别人卷技术,我们卷变现。。。
- B站:啥都会一点的研究生
- 公众号:啥都会一点的研究生
AI科技圈又发生了啥新鲜事?
中国AI大模型与美国分道扬镳,广告投放超3亿
中美之间的 AI 大模型竞赛不再只是“追赶”,而是开始各不相同。中国AI大模型在算力、价格、获客和变现能力上展开竞争,而漂亮国则聚焦于前沿AI技术研究和应用落地。国内AI应用如kimi智能助手、豆包、腾讯元宝等在10月的广告投放支出超过3亿元人民币,其中kimi智能助手以1.99亿元领先。美国AI公司则在算力和应用上持续攻坚,如OpenAI与博通合作研发AI推理芯片,预计2026年量产
https://www.tmtpost.com/7312868.html
继 ChatGPT 后,Anthropic 推出 Claude AI 桌面客户端
Anthropic 旗下人工智能 Claude AI 推出了桌面平台客户端,目前处于测试阶段,支持 Windows、macOS 和 iOS 平台。与 ChatGPT 客户端不同,Claude AI 定位为 AI 搜索引擎,主打语音搜索功能,同时支持写作、解决数学问题、语法检查和文档分析等
https://www.pingwest.com/w/299674
OpenAI联手博通、台积电打造自研AI芯片,预计2026年推出
OpenAI正与博通和台积电合作开发首款自研AI芯片,以应对基础设施需求的急剧扩张。尽管OpenAI曾考虑自行生产芯片,但最终决定搁置建厂计划,转而内部设计芯片。目前,OpenAI已组建约20人的芯片团队,并预计在2026年推出首款定制芯片。据悉,OpenAI今年预计亏损50亿美元,收入37亿美元,其中算力支出是其最大开支,这也促使公司优化资源利用率并拓展供应商渠道
https://www.ithome.com/0/806/288.htm
OpenAI 推出 ChatGPT 搜索功能,挑战谷歌搜索地位
OpenAI 在 ChatGPT 中新增了搜索功能,允许用户直接获取答案和相关网络资源链接。这一功能基于 GPT-4o 微调版本,通过后训练得到 o1-preview 输出支持,未来几个月将向所有免费用户开放。ChatGPT 搜索功能覆盖天气、体育、股票、新闻和地图等多个分类,提供最新信息,并在聊天中直接引用新闻报道和博客文章等来源的链接。
https://wallstreetcn.com/articles/3732593
苹果新款MacBook Pro携M4芯片系列登场,性能与续航全面升级
苹果最新发布的MacBook Pro系列搭载了M4系列芯片,包括M4、M4 Pro和M4 Max,性能显著提升,3D渲染和视频剪辑速度翻倍。新款MacBook Pro支持雷雳5接口,续航时间最长可达24小时,且30分钟可充电至50%。14英寸M4款起售价12999元,而16英寸M4 Max款最高配置售价达57099元
https://zhidx.com/p/452870.html
OpenAI ChatGPT 高级语音模式上线Windows和Mac平台
OpenAI宣布基于GPT-4o模型的ChatGPT高级语音模式(AVM)已登陆Windows和Mac平台,让用户能以更自然的方式与ChatGPT对话,包括打断和停顿等。AVM提供实时感知和回应用户情绪的对话体验,自7月向测试用户开放后,9月底向付费用户推出,并计划向免费用户开放
https://www.ithome.com/0/806/579.htm
GitHub Copilot 引入新AI模型,提升代码辅助能力
GitHub Copilot 近期宣布接入 Anthropic 的 Claude 3.5 Sonnet、Google 的 Gemini 1.5 Pro 和 OpenAI 的 o1-preview 及 o1-mini 模型,以增强其代码辅助能力。Claude 3.5 Sonnet 擅长全软件开发周期任务,而 Gemini 1.5 Pro 支持200万token上下文窗口和多模态处理。o1-preview 和 o1-mini 则具备更先进的推理能力,深入理解代码约束。此外,Perplexity 集成至 Copilot,提供可验证的编程问题解答。GitHub Spark 作为一款AI原生工具,允许用户以自然语言构建应用程序,无需管理云资源。这些更新显示了 GitHub Copilot 在追赶竞争对手如 Cursor 的努力,旨在吸引更多开发者回归
https://www.jiqizhixin.com/articles/2024-10-30-6
Meta、苹果和OpenAI竞逐AI搜索引擎市场
科技巨头Meta秘密研发AI搜索引擎已8个月,旨在提升其聊天机器人的搜索能力,减少对谷歌和微软的依赖。苹果计划将其内部搜索引擎更广泛地应用于App Store及其他应用程序,而OpenAI正在研发AI驱动的SearchGPT,已在有限范围内测试。这些举措预示着传统搜索市场格局正遭遇挑战,同时AI搜索技术的发展也带来了版权问题和隐私保护的挑战
https://zhidx.com/p/452586.html
微软开源OmniParser:AI工具让GPT-4V秒懂屏幕截图
微软开源了一款名为OmniParser的AI工具,能够解析和识别屏幕上的可交互图标,显著提升视觉语言模型(VLMs)在解读复杂图形用户界面(GUI)元素的能力。OmniParser通过结合可交互区域检测模型、图标描述模型和OCR模块,无需依赖HTML标签或视图层次结构,就能在桌面、移动设备和网页上跨平台工作,提高界面解析的准确性。在ScreenSpot数据集中,OmniParser的准确率提高了73%,而GPT-4V在使用OmniParser输出后,图标的正确标记率从70.5%提升至93.8%。这一工具的发布,不仅拓宽了智能体的应用范围,也为开发者提供了一个强大的工具,助力创建更智能、更高效的用户界面驱动智能体
https://www.ithome.com/0/806/006.htm
神秘AI模型“小熊猫”登顶文生图竞技场,性能超群引发猜测
一款名为“red_panda”(小熊猫)的AI文生图模型在竞技场中表现卓越,ELO得分超过Flux 1.1 Pro 100多分,胜率高达79%,每7秒生成一张图像。其神秘身份引发广泛猜测,最终揭晓为英国AI公司最新图像生成模型Recraft V3
https://www.qbitai.com/2024/10/212864.html
阿里通义推出“代码模式”:AI实时编程预览,降低开发门槛
通义最近发布了“代码模式”,一个旨在降低应用开发门槛的AI代码工具,允许用户通过自然语言描述需求,实时生成并预览代码。这一工具特别邀请非专业程序员参与测试,以验证其易用性。通义代码模式基于Qwen 2.5大模型开发,支持40多种编程语言,其代码能力相比常规模式提升了30%以上。用户可以轻松创建各类应用,如小游戏、网页和数据图表等,而无需深入了解底层代码逻辑
https://www.jiqizhixin.com/articles/2024-10-28-6
迪士尼成立新AI部门,探索AI和混合现实技术潜力
华特迪士尼正在组建“技术赋能办公室”,由首席技术官杰米・沃里斯领导,旨在协调公司对AI和混合现实等新兴技术的使用,并探索这些技术在电影、电视和主题公园等业务中的潜力。迪士尼娱乐联合主席艾伦・伯格曼强调,人工智能和XR技术将对未来消费者体验和业务产生深远影响,迪士尼必须抓住机遇,同时审慎管理潜在风险
https://www.ithome.com/0/807/415.htm