当前位置：首页 > news >正文

【AIGC半月报】AIGC大模型启元：2024.12（上）

news 2025/3/9 22:49:51

【AIGC半月报】AIGC大模型启元：2024.12（上）

- （1）OpenAI-12日发布会（持续更新中........）
- - Day01-12.06：o1满血版上线（已发布）
  - Day02-12.07：强化微调（Reinforcement Fine-Tuning）（已发布）
  - Day03-12.08：ChatGPT+高级语音功能+增强视觉
  - Day04-12.09：向免费用户发布o1-preview
  - Day05-12.10：新AI Agent预展示
  - Day06-12.11：GPT-4o图像
  - Day07-12.12：新开发者工具
  - Day08-12.13：新文生图模型
  - Day09-12.14：下一代长上下文窗口的GPT模型
  - Day10-12.15：辩论游戏
  - Day11-12.16：Microscope
  - Day12-12.17：增加高级语音使用时长

（1）OpenAI-12日发布会（持续更新中…）

Day01-12.06：o1满血版上线（已发布）

整个发布会仅持续不到15分钟，但包含了巨大的信息量：相比preview版本，满血o1的数学和代码能力均大幅提升，Pro版则是再上一层楼。满血版推理速度更快，比preview快了60%。网友们期待的多模态推理，满血版o1也安排上了。
而满血o1的另一大亮点就是支持多模态输入，具备视觉推理能力，团队也进行了现场展示。

在这里插入图片描述
参考博客：
OpenAI第一场直播就炸场！o1满血版上线，史上最贵订阅费：1450元/月
新o1登顶中文链式推理基准，总分76.12分，速度提升41%

Day02-12.07：强化微调（Reinforcement Fine-Tuning）（已发布）

新功能强化微调（Reinforcement Fine-Tuning），使用极少训练数据即在特定领域轻松地创建专家模型。少到什么程度呢？最低几十个例子就可以。CEO奥特曼表示“效果一级棒，是我2024年最大的惊喜，期待看到人们构建什么！”
　　这次发布的主题虽然和普通人没什么关系，但是给领域垂直模型、小型化模型等开辟巨大的想象空间。在现有模型基础上，花费有限算力和数据做增强改进，训练出一个更强的模型。未来很快，就会出现各个领域的o1模型。
　　前有OpenAI已经搞定一个强基模型，加上一些高质量的推理问题数据集（不需要正确的推理过程，只要有正确的答案就行），任何人都可以通过Reinforcement Learning Fine-tuning，在现有强大的推理模型基础上训练出推理能力更强的模型。或者，蒸馏出一个更紧凑的小模型，有了领域私有数据和业务逻辑复杂的推理数据集，训出表现更好领域模型。

微调后的o1-mini模型得分提高80%，直接反超o1正式版。
目前OpenAI已开启强化微调研究计划，开发者可以申请强化微调API的alpha版本访问权限。
进行测试时，可使用几十到几千个高质量数据，模型能够通过强化学习自行探索和学习如何推理复杂任务。

强化微调（Reinforcement Fine-Tuning，简称ReFT）
　　一种全新(区别于之前的监督微调)的模型定制技术，允许开发者通过数十到数千个高质量任务的数据集，对模型进行针对性优化，并根据提供的参考答案对模型的响应进行评分，使AI在特定领域的复杂任务中表现得更为精准。

参考博客：
OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜
OpenAI Day2：支持微调o1, 核心技术竟更早来自字节跳动！「强化微调」技术分析

Day03-12.08：ChatGPT+高级语音功能+增强视觉

增强ChatGPT的高级语音模式，增加视觉功能。
Enhancement of ChatGPT’s Advanced Voice Mode with vision capabilities.

Day04-12.09：向免费用户发布o1-preview

向免费用户发布o1-preview，扩大高级推理模型的使用范围。
Release of o1-preview to free users,expanding access to advanced reasoning models.

Day05-12.10：新AI Agent预展示

展示将在2025年一月推出的AI Agent
Showcase of the GPT Agents coming in January

Day06-12.11：GPT-4o图像

发布GPT-4o图像
Launch of GPT-4o images

Day07-12.12：新开发者工具

发布新的开发者工具
New Developer tools

Day08-12.13：新文生图模型

展示新的文生图模型
Showcase of new Dalle

Day09-12.14：下一代长上下文窗口的GPT模型

发布下一个GPT模型，更大的上下文窗口。
Announcement of the GPT-NEXT model with a bigger context window

Day10-12.15：辩论游戏

发布辩论游戏，教机器辩论简单的问题。
Release of the Debate Game,teaching machines to debate toy problems.

Day11-12.16：Microscope

发布Microscope，这是一个神经网络模型的可视化集合。
Launch of Microscope,a collection of visualizations of neural network models.

Day12-12.17：增加高级语音使用时长

将高级语音模式的使用时间增加到每天20小时
Increases the Advanced voice mode time to 20 hours per day

Sora
发布文生视频模型Sora
Launch of Sora.the text-to-video AI tool.
ChatGPT+圣诞老人风格的语音
为ChatGPT引入一个圣诞老人风格的语音，增添节日气氛。
Introduction of a Santa-inspired voice for ChatGPT, adding festive flair.

查看全文

http://www.mrgr.cn/news/79333.html