【AIGC半月报】AIGC大模型启元:2024.12(上)
【AIGC半月报】AIGC大模型启元:2024.12(上)
- (1)OpenAI-12日发布会(持续更新中........)
- Day01-12.06:o1满血版上线(已发布)
- Day02-12.07:强化微调(Reinforcement Fine-Tuning)(已发布)
- Day03-12.08:ChatGPT+高级语音功能+增强视觉
- Day04-12.09:向免费用户发布o1-preview
- Day05-12.10:新AI Agent预展示
- Day06-12.11:GPT-4o图像
- Day07-12.12:新开发者工具
- Day08-12.13:新文生图模型
- Day09-12.14:下一代长上下文窗口的GPT模型
- Day10-12.15:辩论游戏
- Day11-12.16:Microscope
- Day12-12.17:增加高级语音使用时长
(1)OpenAI-12日发布会(持续更新中…)
Day01-12.06:o1满血版上线(已发布)
整个发布会仅持续不到15分钟,但包含了巨大的信息量:相比preview版本,满血o1的数学和代码能力均大幅提升,Pro版则是再上一层楼。满血版推理速度更快,比preview快了60%。网友们期待的多模态推理,满血版o1也安排上了。
而满血o1的另一大亮点就是支持多模态输入,具备视觉推理能力,团队也进行了现场展示。
参考博客:
OpenAI第一场直播就炸场!o1满血版上线,史上最贵订阅费:1450元/月
新o1登顶中文链式推理基准,总分76.12分,速度提升41%
Day02-12.07:强化微调(Reinforcement Fine-Tuning)(已发布)
新功能强化微调(Reinforcement Fine-Tuning),使用极少训练数据即在特定领域轻松地创建专家模型。少到什么程度呢?最低几十个例子就可以。CEO奥特曼表示“效果一级棒,是我2024年最大的惊喜,期待看到人们构建什么!”
这次发布的主题虽然和普通人没什么关系,但是给领域垂直模型、小型化模型等开辟巨大的想象空间。在现有模型基础上,花费有限算力和数据做增强改进,训练出一个更强的模型。未来很快,就会出现各个领域的o1模型。
前有OpenAI已经搞定一个强基模型,加上一些高质量的推理问题数据集(不需要正确的推理过程,只要有正确的答案就行),任何人都可以通过Reinforcement Learning Fine-tuning,在现有强大的推理模型基础上训练出推理能力更强的模型。或者,蒸馏出一个更紧凑的小模型,有了领域私有数据和业务逻辑复杂的推理数据集,训出表现更好领域模型。
- 微调后的o1-mini模型得分提高80%,直接反超o1正式版。
- 目前OpenAI已开启强化微调研究计划,开发者可以申请强化微调API的alpha版本访问权限。
- 进行测试时,可使用几十到几千个高质量数据,模型能够通过强化学习自行探索和学习如何推理复杂任务。
强化微调(Reinforcement Fine-Tuning,简称ReFT)
一种全新(区别于之前的监督微调)的模型定制技术,允许开发者通过数十到数千个高质量任务的数据集,对模型进行针对性优化,并根据提供的参考答案对模型的响应进行评分,使AI在特定领域的复杂任务中表现得更为精准。
参考博客:
OpenAI强化微调登场:几十条数据o1-mini反超o1暴涨80%,奥特曼:今年最大惊喜
OpenAI Day2:支持微调o1, 核心技术竟更早来自字节跳动!「强化微调」技术分析
Day03-12.08:ChatGPT+高级语音功能+增强视觉
增强ChatGPT的高级语音模式,增加视觉功能。
Enhancement of ChatGPT’s Advanced Voice Mode with vision capabilities.
Day04-12.09:向免费用户发布o1-preview
向免费用户发布o1-preview,扩大高级推理模型的使用范围。
Release of o1-preview to free users,expanding access to advanced reasoning models.
Day05-12.10:新AI Agent预展示
展示将在2025年一月推出的AI Agent
Showcase of the GPT Agents coming in January
Day06-12.11:GPT-4o图像
发布GPT-4o图像
Launch of GPT-4o images
Day07-12.12:新开发者工具
发布新的开发者工具
New Developer tools
Day08-12.13:新文生图模型
展示新的文生图模型
Showcase of new Dalle
Day09-12.14:下一代长上下文窗口的GPT模型
发布下一个GPT模型,更大的上下文窗口。
Announcement of the GPT-NEXT model with a bigger context window
Day10-12.15:辩论游戏
发布辩论游戏,教机器辩论简单的问题。
Release of the Debate Game,teaching machines to debate toy problems.
Day11-12.16:Microscope
发布Microscope,这是一个神经网络模型的可视化集合。
Launch of Microscope,a collection of visualizations of neural network models.
Day12-12.17:增加高级语音使用时长
将高级语音模式的使用时间增加到每天20小时
Increases the Advanced voice mode time to 20 hours per day
Sora
发布文生视频模型Sora
Launch of Sora.the text-to-video AI tool.
ChatGPT+圣诞老人风格的语音
为ChatGPT引入一个圣诞老人风格的语音,增添节日气氛。
Introduction of a Santa-inspired voice for ChatGPT, adding festive flair.