当前位置: 首页 > news >正文

OpenAI 的新 o1 模型可以「慢慢想」答案

OpenAI 發表了其最新的 AI 模型,名為「o1」,一般認為就是早先報導過,代號為「Strawberry(草莓)」的祕密計畫。據 OpenAI 稱,該模型可以比過去的模型花更多的時間思考、推敲問題;嘗試不同的策略來解題;並認識錯誤並修正答案,來提高答案的準確度,「就像真人一樣」。

如果稍微注意一下的話,就會發現新的模型名稱不僅重新回到「1」開始,而且也拿掉了「GPT」。這意味著 o1 和 GPT 系列採取了不同的策略,不再是靠統計預測的方式,去「猜」下一個字應該是什麼,而是會整體的考慮問題和答案的邏輯性。OpenAI 表示,它在物理、化學和生物學的困難問題解題方面,與該領域的博士生表現相似,而在數學和編程等方面表現還更加出色。OpenAI 目前的旗艦模型 GPT-4o 在國際數學奧林匹克競賽的資格考試中,僅能正確回答 13% 的問題,而 o1 則解決了高達 83%。

o1 的另一個「創舉」,就是開啟了「思考時間」做為另一個加強 AI 結果的維度。現有的 AI 模型中,絕大部份時間都是花在模型的訓練上,一旦模型推出後,每一次的使用耗費的運算資源相對的是低的。但 o1 的出現,證實了在使用階段投入更多的運算資源,也是可以針對各別的問題來強化答案的。和 GPT 一般強調快速不同,o1 目前的運算時間可以花上十秒,乃至於數十秒,因此會更加適合要求答覆的品質高於速度的應用。

此外,o1 模型不具備網路瀏覽、文件上傳或圖像的能力,在文字生成上相對於 GPT-4o 也沒有明顯的進步,再加上速度緩慢,對於大部份人的一般應用和商務應用來說,GPT-4o 可能還是更加合適的選擇,目前 OpenAI 更多還是瞄準了學術界,特別是理論物理學之類有複雜數學運算需求的領域。不過,儘管有更長時間考慮其輸出,o1 也尚未完全解決「幻覺」的問題,因此最終還是要人類來做最後的檢查了。

o1 的發展仍處於起步階段,初步推出 o1-preview 和 o1-mini 兩個模型。前者是完整 o1 的「預覽版」,在能力上略有折扣;而 o1-mini 則是輕量化的模型,會更快、更便宜一些,並且特別會寫程式。由於 o1 的運算力需求大幅提升,目前僅開放付費用戶試用,而且有非常嚴格的用量限制 —— o1-preview 是每週僅能送出少少的 30 個訊息,o1-mini 也只有 50 個。


http://www.mrgr.cn/news/33185.html

相关文章:

  • 数据库设计时,什么时候使用自增id,什么时候不使用自增id,谈谈你的理解? --------面试题分享
  • 0基础学习HTML(十一)列表
  • 0基础学习HTML(十)表格
  • 对软件进行调试
  • 4、FPGA特征简介
  • Linux下编程实现网络传送文件
  • Java | Leetcode Java题解之第424题替换后的最长重复字符
  • Golang | Leetcode Golang题解之第424题替换后的最长重复字符
  • 【全网最全】2024年华为杯研赛B题成品论文获取入口(后续会更新)
  • NLP 主要语言模型分类
  • Postman cURL命令导入导出
  • 【CSS in Depth 2 精译_036】5.6 Grid 网格布局中与对齐相关的属性 + 5.7本章小结
  • SkyWalking 接入微服务
  • 医院伤员小程序点餐———未来之窗行业应用跨平台架构
  • 几何最起码常识凸显“井底蛙”数学一直将无穷多各异射线误为同一线
  • ESP32-WROOM-32 [创建AP站点-客户端-TCP透传]
  • 联合和枚举
  • C语言 | Leetcode C语言题解之第423题从英文中重建数字
  • 在Ubuntu 18.04上使用rbenv安装Ruby on Rails的方法
  • linux如何启用ipv6随机地址