支付宝开放平台-开发者社区——AI 日报「9 月 20 日」
1 阿里通义万相AI生视频震撼上线!更懂中国风的大模型来了
新智元|阅读原文
阿里放大招了,就在刚刚,通义万相AI视频功能正式开放。昨天下午的阿里云栖大会上,CTO周靖人宣布,官网和App上都可以立刻试用了。比起国外爆火的Sora、Gen-3 Alpha,通义万相是更能听懂中国话,更懂中国风的AI视频模型。它能够支持最长5秒视频生成,每秒30帧,分辨率为720P。更惊艳的是,它还能生成与画面匹配的音效。这背后得到了阿里全自研的视觉大模型加持,并采用了业界领先的核心架构——Diffusion+Transformer。划重点:手机端App不限次数,完全免费用!PC端,每天登陆送50个灵感值,可生成10次。
2 OpenAI o1全方位SOTA登顶lmsys排行榜!数学能力碾压Claude和谷歌模型,o1-mini并列第一
新智元|阅读原文
万众瞩目的最新模型OpenAI o1,终于迎来了lmsys竞技场的测评结果。不出意外,o1-preview在各种领域绝对登顶,超过了最新版的GPT-4o,在数学、困难提示和编码领域表现出色;o1模型发布1周,lmsys的6k+投票就将o1-preview送上了排行榜榜首。同时,为了满足大家对模型「IOI金牌水平」的好奇心,OpenAI放出了o1测评时提交的所有代码。
3 字节音乐大模型炸场!Seed-Music发布,支持一键生成高质量歌曲、片段编辑等
机器之心|阅读原文
据豆包大模型团队官网介绍,Seed-Music 是一个具有灵活控制能力的音乐生成系统,包含 Lyrics2Song、Lyrics2Leadsheet2Song、Music Editing、Singing Voice Conversion 四大核心功能,具体涵盖十种创作任务。刚发布,Seed-Music 就已经在海外平台引起了关注。
Seed-Music 官网:https://team.doubao.com/seed-music
4 阿里云Qwen2.5发布!再登开源大模型王座,Qwen-Max性能逼近GPT-4o
机器之心|阅读原文
在 9 月 19 日的云栖大会上,CTO 周靖人宣布:通义千问发布新一代开源模型 Qwen2.5,开源旗舰模型 Qwen2.5-72B 性能超越 Llama 3.1-405B,再次登上全球开源大模型的王座;通义旗舰模型 Qwen-Max 全方位升级,性能已经逼近 GPT-4o。
对此,你怎么看?
详情查看参与互动赢蚂蚁周边
支付宝开放平台-开发者社区
「AGI 之路」 内容库
欢迎你的投稿!戳我进群
支付宝/钉钉扫码加入支付宝开发者钉组织,可了解支付宝开放能力最新动态,订阅文档更新消息,和同城同行业交流业务,与支付宝产研沟通交流。