当前位置: 首页 > news >正文

20240916 每日AI必读资讯

超强o1模型智商已超120!1小时写出NASA博士1年代码,最新编程赛超越99.8%选手

- 一位UCI物理学博士实测o1,发现自己用时1年完成的博士论文代码,竟被AI在1个小时之内实现了。

- o1在最新门萨智商测试中,IQ水平竟超过了120分。35个智商题,答对了25道,把其他模型甩出好几条街。

🔗 超强o1模型智商已超120!1小时写出NASA博士1年代码,最新编程赛超越99.8%选手

GOT-OCR2.0:一款端到端的 OCR 模型 

- 可以处理各种复杂的OCR任务,不仅包括普通文本,还可以识别公式、表格、乐谱等复杂内容。

- OCR-2.0主要支持中文和英文字符识别,并能够通过进一步的微调扩展到更多语言。

• 场景文本识别:能够处理自然场景中的文本识别任务,如街道标志、广告牌上的文字等。

• 文档OCR:处理文档中完整页面的文字识别,无论是纯文本文档,还是含有表格、公式等的复杂文档。

• 格式化文本OCR:支持将光学文档中的文本直接转换为 Markdown、Latex 等格式,保持复杂文档的原始排版和格式。

• 动态分辨率:GOT 支持对超高分辦率图像(如大幅海报、拼接PDF页面)进行OCR处理,使用动态分辨率技术确保在图像过大时保持识别准确性。

• 多页OCR:GOT 能够批量处理多页文档,例如长篇PDF文件或包含多张图片的OCR任务,极大提升了处理效率。

• 公式、表格、图表识别:除了基本文本识别,GOT 还能识别和处理文档中的数学公式、化学分子式、表格、图表等复杂结构,并将其转换为可编辑的格式(如LaTex 或 Python 字典格式)。

• 格式化输出:OCR-2.0支持生成多种格式化输出,包括Markdown、TikZ、SMILES、LATEX等,能够将识别到的字符以结构化的方式输出,例如表格、数学公式、分子结构等。

- GOT模型还能够进行交互式OCR处理,允许用户通过输入坐标或颜色提示,指定识别图像的特定区域。 

- OT-OCR2.0 在多种OCR任务中均表现出色,特别是在文档OCR、格式化文档OCR、场景文本识别和细粒度交互OCR任务中。它不仅具备处理传统文本的强大能力,还能够应对乐谱、几何图形等更加复杂的任务。

🔗GitHub:https://github.com/Ucas-HaoranWei/GOT-OCR2.0


StoryTribe :一个免费的在线故事板制作工具 

- 无需绘画技能轻松制作故事板

- 非常容易上手,内置大量可用的图形资产、插画、场景道具和角色组合,支持多种文化、种族和体型。

- 可以通过轻松的拖动、简单操作即可创作出各种各样的故事版。

- 可以用来制作影视剧脚本故事版,图解流程图,各种插画海报、简单故事等...

- 还可以与实际照片背景无缝结合,增强沉浸感。

🔗网站:https://storytribeapp.com

🔗https://blink.csdn.net/details/1815478 


http://www.mrgr.cn/news/28304.html

相关文章:

  • 前端web
  • 推荐一款优秀的Flash幻灯片制作软件:Flash Gallery Factory
  • 关于 MSVCP110.dll 缺失的解决方案
  • UVa 11855 Buzzwords
  • 自动化运维(k8s):一键获取指定命名空间镜像包脚本
  • GitLab 如何降级?
  • 认知杂谈68《燃爆!兄弟萌不可错过的人生开挂宝典》
  • OJ在线评测系统 后端项目初始化 Springboot项目通用模版讲解
  • 2025秋招LLM大模型多模态面试题(七)- 思维链CoT
  • 【我的 PWN 学习手札】Unsortedbin Attack
  • 【苍穹外卖】总结
  • Leetcode 找到字符串中所有字母异位词
  • 研究生招生宣传(2024秋)
  • 12 数组——27. 移除元素 ★
  • 1. TypeScript基本语法
  • Autosar BswM配置-手动建立Swc Port实现自定义模式切换
  • Anaconda安装并配置Python环境
  • STM32外设之LTDC/DMA2D—液晶显示(野火)
  • Zookeeper学习
  • java实现系统文件管理
  • 鸿蒙媒体开发系列01——资源分类访问
  • 深入剖析:C++类对象的内存布局与优化
  • 【C++】——list
  • OJ题-反转链表
  • 利士策分享,家和万事兴:幸福生活的基石
  • Linux 开发工具(vim、gcc/g++、make/Makefile)+【小程序:进度条】-- 详解