当前位置: 首页 > news >正文

通义千问QvQ-72B-Preview模型部署

通义千问QwQ-72B-Preview模型部署

  • 准备工作
    • 模型下载
      • 相关链接
      • 模型效果
      • 下载模型
      • 环境准备
  • 模型部署
    • 部署代码
    • 测试模型

准备工作

模型下载

相关链接

中文blog:https://qwenlm.github.io/zh/blog/
Modelscope开源地址:https://modelscope.cn/models/Qwen/QvQ-72B-Preview
Modelscope创空间体验:https://modelscope.cn/studios/Qwen/QvQ-32B-preview
HuggingFace开源地址:https://huggingface.co/Qwen/QvQ-72B-Preview
HuggingFace Space体验:https://huggingface.co/spaces/Qwen/QvQ-72B-preview

模型效果

官方数据
在这里插入图片描述

下载模型

本次实验在4090上进行测试,为了顺利加载模型,下载的是量化版本的模型。模型结构如下:
在这里插入图片描述

环境准备

conda activate qvq
pip install transformers
pip install qwen

http://www.mrgr.cn/news/82035.html

相关文章:

  • Unity 3D柱状图效果
  • 点击<el-dropdown>中某一项跳转页面时,控制台报错的问题
  • Redis 发布订阅(Pub/Sub)机制详解
  • Spring Security(maven项目) 3.0.2.3版本
  • 数字图像总复习
  • 详细解读SBTI科学碳目标
  • FOC控制原理-ADC采样时机
  • HarmonyOS NEXT应用开发实战:免费练手的网络API接口分享
  • 数据结构与算法之动态规划: LeetCode 1143. 最长公共子序列 (Ts版)
  • 后端开发-Maven
  • 细说STM32F407单片机CAN基础知识及其HAL驱动程序
  • FPGA多路红外相机视频拼接输出,提供2套工程源码和技术支持
  • 数据结构与算法之动态规划: LeetCode 674. 最长连续递增序列 (Ts版)
  • 配置中心 之 apollo
  • Postman[8] 断言
  • python文件操作相关(excel)
  • SpringJPA使用崩溃了
  • Web安全 - “Referrer Policy“ Security 头值不安全
  • RK3568 bsp 9 - USB调试记录
  • 深度学习blog- 数学基础(全是数学)
  • C++类与对象(三)-- 再谈构造函数(细嗦初始化列表)、static成员
  • 《机器学习》从入门到实战——逻辑回归
  • 机器学习之逻辑回归算法、数据标准化处理及数据预测和数据的分类结果报告
  • JDK 21 的重要特性
  • Java方法使用详解:从基本概念到进阶技巧
  • 一个响应式的系统 具有黑白俩个主题