当前位置: 首页 > news >正文

【AIGC半月报】AIGC大模型启元:2024.09(下)

【AIGC半月报】AIGC大模型启元:2024.09(下)

    • (1) Qwen2.5(阿里巴巴LLM)

(1) Qwen2.5(阿里巴巴LLM)

2024.09.019 阿里巴巴官宣了史上最大规模的开源发布,推出了基础模型Qwen2.5、专用于编码Qwen2.5-Coder和数学的Qwen2.5-Math。
这三大类模型一共有10多个版本,包括0.5B、1.5B、3B、7B、14B、32B和72B,适用于个人、企业以及移动端、PC等不同人群不同业务场景的模型。
如果不想进行繁琐的部署,阿里还开放了旗舰模型Qwen-Plus 和 Qwen-Turbo的API,帮助你快速开发或集成生成式AI功能。
本次阿里开源的最大版本指令微调模型Qwen2.5-72B在MMLU-Pro

  • MMLU-redux、GPQA、MATH、GSM8K、HumanEval、MBPP等全球知名基准测试平台的测试结果显示。
  • 虽然Qwen2.5只有720亿参数,但在多个基准测试中击败了Meta拥有4050亿参数的最新开源Llama-3.1指令微调模型;全面超过了Mistral最新开源的Large-V2指令微调模型,成为目前最强大参数的开源模型之一。

推荐文章: 阿里史上最大规模开源发布,超GPT-4o 、Llama-3.1!
开源地址: https://huggingface.co/collections/Qwen/qwen25-66e81a666513e518adb90d9e
GitHub: https://github.com/QwenLM/Qwen2.5?tab=readme-ov-file
在线demo: https://huggingface.co/spaces/Qwen/Qwen2.5
API地址: https://help.aliyun.com/zh/model-studio/developer-reference/what-is-qwen-llm


http://www.mrgr.cn/news/30064.html

相关文章:

  • 【数据结构】排序算法---归并排序
  • Halcon OCR检测 免训练版
  • GEC6818初次连接使用
  • C++(学习)2024.9.18
  • 新手教学系列——非正常关机导致MySQL权限表(db)损坏及修复详解
  • 健康监测功能或暂缓亮相,Apple Watch Series 10最新爆料解析
  • Find My太阳镜|苹果Find My技术与太阳镜结合,智能防丢,全球定位
  • 关于联想笔记本开机无法正常进入到桌面,提示Check Date and Time settings错误的解决方法
  • JavaAPI-String和StringBuffer
  • 【AI大模型】LLM主流开源大模型介绍
  • 网络安全自学笔记
  • iOS17找不到developer mode
  • # 软考 -- 软件设计师 -- 二轮复习(5) -- 面向对象(持续更新)
  • 记软件开发者画图(UML),使用WPS应用制图
  • 【人工智能】如何利用AI高效解决Linux中出现的严重问题?程序员必看小技巧!
  • 【C++笔记】八、结构体 [ 1 ]
  • Linux StableDiffusion下载外网插件失败, 自己下载安装
  • 如何做好一个网站建设的规划?
  • 图神经网络模型的应用(8)--1
  • CST电磁仿真77GHz汽车雷达保险杠