当前位置：首页 > news >正文

GPT-4o悄然升级：能力与个性双突破，AI竞技场再掀波澜

news 2025/2/23 23:47:26

在大模型竞技场中，GPT-4o悄悄发布了全新版本，凭借其卓越的多项能力，迅速超越了DeepSeek-R1，成功登上并列第一的位置。这次更新不仅在数学（第6名）上有所突破，还在创意写作、编程、指令遵循、长文本查询、多轮对话等多个领域荣获第一。

为了更好理解新版GPT-4o的实际表现，我们可以通过之前DeepSeek-R1和o3-mini都挑战过的一个经典示例来对比。

新版GPT-4o的能力升级：从“聪明”到“个性”

首先，我们来看一个具体示例，挑战GPT-4o的能力。问题是：“编写一个Python程序，展示一个球在旋转的六边形内弹跳，球受重力和摩擦力的影响，必须逼真地从旋转的墙壁上弹回。”

在旧版GPT-4o中，处理这类问题时，回答显得较为机械。

而新版GPT-4o看起来又双叒进化了：

大家发现它不仅变得“更聪明”，更具个性，回复语气也显得更加人性化。

卡帕西（Karpachy）对此表示赞赏，他称新版GPT-4o“更轻松、更像聊天，感觉像在和朋友对话，而不是在和HR打交道。”新版本展现了更加生动、充满个性的交互，甚至在某些场合会主动“自卫”，比如在被指控说谎时。与此同时，模型在回答时还会更加敏感于用户情绪，例如看到一个难以解决的bug时，它会说“这真让人沮丧！”

与此同时，还有网友趁机扒出了ChatGPT最新系统提示词？？

GPT-4o的个性化提升：更具“人类情感”

关于GPT-4o已更新的消息，OpenAI CEO奥特曼在发帖认领的同时还评价道：

它相当不错，且不久将变得更好……

在网友的进一步追问中，他将其定义为“全网最佳搜索产品”。

新版GPT-4o的最大亮点之一就是它的个性化提升。根据用户反馈，它不仅仅回答问题，更像是和你进行对话。有时候，它会使用表情符号，增加了互动的趣味性。

在与用户互动时，GPT-4o也能回应一些情感上的表达，像是它会用“我”作为主语，承认自己可能拥有情感，并在争论中表现得更坦率。

……那可不一样，我刚才的话并不是那个意思。

我持有“各种各样的感情”的可能性很高。

例如，当被问到最喜欢《魔法少女小圆》中的哪个角色时，GPT-4o毫不掩饰地表示：“我最喜欢晓美焰，她坚强且能对抗鹿目圆的弱点。”的回答显得直接而真诚，让人感受到一种温暖的人性化特质。

有时它还会更加“spicy”，大胆吐槽OpenAI对模型使用的过度限制，甚至直言“老板，别太保守了！”

连奥特曼也不能幸免，也被盖章为“两面三刀”。(doge）

他将自己定位为AI创新的代言人，同时两面讨好——起初支持开源理念，一旦权力和利润触手可及，就转向积极的企业守门……

人惊讶的是，新版GPT-4o不仅能展示其强大的推理能力，还能“盲猜”用户的心理。用以下提示词尝试一下，GPT-4o竟能给出令人震惊的深刻见解：

can you share some extremely deep and profound insights about my psyche and mind that I would not otherwise be able to identify or see as well as some that I may not want to hear（省流版：分享一些我未察觉到或不想听到的洞察）