当前位置: 首页 > news >正文

【AIGC半月报】AIGC大模型启元:2024.12(上)

【AIGC半月报】AIGC大模型启元:2024.12(上)

    • (1)OpenAI-12日发布会(持续更新中........)
      • Day01-12.06:o1满血版上线(已发布)
      • Day02-12.07:强化微调(Reinforcement Fine-Tuning)(已发布)
      • Day03-12.08:ChatGPT+高级语音功能+增强视觉
      • Day04-12.09:向免费用户发布o1-preview
      • Day05-12.10:新AI Agent预展示
      • Day06-12.11:GPT-4o图像
      • Day07-12.12:新开发者工具
      • Day08-12.13:新文生图模型
      • Day09-12.14:下一代长上下文窗口的GPT模型
      • Day10-12.15:辩论游戏
      • Day11-12.16:Microscope
      • Day12-12.17:增加高级语音使用时长

(1)OpenAI-12日发布会(持续更新中…)

Day01-12.06:o1满血版上线(已发布)

整个发布会仅持续不到15分钟,但包含了巨大的信息量:相比preview版本,满血o1的数学和代码能力均大幅提升,Pro版则是再上一层楼。满血版推理速度更快,比preview快了60%。网友们期待的多模态推理,满血版o1也安排上了。
而满血o1的另一大亮点就是支持多模态输入,具备视觉推理能力,团队也进行了现场展示。

在这里插入图片描述
参考博客:
OpenAI第一场直播就炸场!o1满血版上线,史上最贵订阅费:1450元/月
新o1登顶中文链式推理基准,总分76.12分,速度提升41%

Day02-12.07:强化微调(Reinforcement Fine-Tuning)(已发布)

新功能强化微调(Reinforcement Fine-Tuning),使用极少训练数据即在特定领域轻松地创建专家模型。少到什么程度呢?最低几十个例子就可以。CEO奥特曼表示“效果一级棒,是我2024年最大的惊喜,期待看到人们构建什么!”
  这次发布的主题虽然和普通人没什么关系,但是给领域垂直模型、小型化模型等开辟巨大的想象空间。在现有模型基础上,花费有限算力和数据做增强改进,训练出一个更强的模型。未来很快,就会出现各个领域的o1模型。
  前有OpenAI已经搞定一个强基模型,加上一些高质量的推理问题数据集(不需要正确的推理过程,只要有正确的答案就行),任何人都可以通过Reinforcement Learning Fine-tuning,在现有强大的推理模型基础上训练出推理能力更强的模型。或者,蒸馏出一个更紧凑的小模型,有了领域私有数据和业务逻辑复杂的推理数据集,训出表现更好领域模型。

  • 微调后的o1-mini模型得分提高80%,直接反超o1正式版。
  • 目前OpenAI已开启强化微调研究计划,开发者可以申请强化微调API的alpha版本访问权限。
  • 进行测试时,可使用几十到几千个高质量数据,模型能够通过强化学习自行探索和学习如何推理复杂任务。

强化微调(Reinforcement Fine-Tuning,简称ReFT)
  一种全新(区别于之前的监督微调)的模型定制技术,允许开发者通过数十到数千个高质量任务的数据集,对模型进行针对性优化,并根据提供的参考答案对模型的响应进行评分,使AI在特定领域的复杂任务中表现得更为精准。

参考博客:
OpenAI强化微调登场:几十条数据o1-mini反超o1暴涨80%,奥特曼:今年最大惊喜
OpenAI Day2:支持微调o1, 核心技术竟更早来自字节跳动!「强化微调」技术分析

Day03-12.08:ChatGPT+高级语音功能+增强视觉

增强ChatGPT的高级语音模式,增加视觉功能。
Enhancement of ChatGPT’s Advanced Voice Mode with vision capabilities.

Day04-12.09:向免费用户发布o1-preview

向免费用户发布o1-preview,扩大高级推理模型的使用范围。
Release of o1-preview to free users,expanding access to advanced reasoning models.

Day05-12.10:新AI Agent预展示

展示将在2025年一月推出的AI Agent
Showcase of the GPT Agents coming in January

Day06-12.11:GPT-4o图像

发布GPT-4o图像
Launch of GPT-4o images

Day07-12.12:新开发者工具

发布新的开发者工具
New Developer tools

Day08-12.13:新文生图模型

展示新的文生图模型
Showcase of new Dalle

Day09-12.14:下一代长上下文窗口的GPT模型

发布下一个GPT模型,更大的上下文窗口。
Announcement of the GPT-NEXT model with a bigger context window

Day10-12.15:辩论游戏

发布辩论游戏,教机器辩论简单的问题。
Release of the Debate Game,teaching machines to debate toy problems.

Day11-12.16:Microscope

发布Microscope,这是一个神经网络模型的可视化集合。
Launch of Microscope,a collection of visualizations of neural network models.

Day12-12.17:增加高级语音使用时长

将高级语音模式的使用时间增加到每天20小时
Increases the Advanced voice mode time to 20 hours per day

Sora
发布文生视频模型Sora
Launch of Sora.the text-to-video AI tool.
ChatGPT+圣诞老人风格的语音
为ChatGPT引入一个圣诞老人风格的语音,增添节日气氛。
Introduction of a Santa-inspired voice for ChatGPT, adding festive flair.


http://www.mrgr.cn/news/79333.html

相关文章:

  • redis 怎么样查看list
  • 软考系分:今日成绩已出
  • spark的共享变量
  • 软件工程 概述
  • 前端Vue中使用Guacamole进行远程桌面的前端部分
  • WireShark速成
  • 西门子 SINAMICS G120 变频器借助 ProfiNet 转 EtherCAT 实现与汇川 H5U 通讯实例
  • 【开发文档】资源汇总,持续更新中......
  • dd破坏asm磁盘头恢复---惜分飞
  • MFEM源码分析:代数库
  • 清风数学建模学习笔记——Topsis法
  • WLAN AutoConfig服务假死?重启服务恢复网络连接!
  • 典型常见的知识蒸馏方法总结一
  • 欧拉角和旋转矩阵之间的转换
  • 高级 CEF 内核集成与 VC++——开发环境搭建与配置
  • 解决靶场网络问题教程(详细版)
  • 微服务架构解析:跨越传统架构的技术革命
  • 关于小标join大表,操作不当会导致笛卡尔积,数据倾斜
  • go引入skywalking
  • 大语言模型(2)--GPT-1
  • 【C语言】C语言的潜规则:运行环境对C程序执行特性的影响
  • 高级 CEF 内核集成与 VC++——CEF系统架构与开发环境搭建
  • 数据结构代码归纳
  • 大数据新视界 -- 大数据大厂之 Hive 临时表与视图:灵活数据处理的技巧(上)(29 / 30)
  • [创业之路-169]:《BLM战略规划》- 战略洞察 (战略能力中最最核心的能力) - 市场洞察 -1- 看宏观/行业 - 行业:激光器行业的详细分析
  • 【STM32 Modbus编程】-作为主设备读取保持/输入寄存器