当前位置: 首页 > news >正文

MiniMind环境搭建训练推理测试

引子

写了那么多篇大模型环境搭建推理部署的blog,如果没记错有几篇就是因为GPU资源hold不住,没有无法得到最终结果的(智谱AI GLM-4V-9B视觉大模型环境搭建&推理-CSDN博客)。我个人一直觉得大模型发展最终还是要走向端侧,小型化,只是也许没那么快来到。但是这个方向还是一直要有人坚持去做的,这不,这两天翻到一个,MiniMind,只要3小时就能训练一个26M的大模型。OK,那就让我们开始吧。

一、模型介绍

MiniMind 是一个轻量级的大语言模型项目,让用户可以在个人设备上快速训练和运行GPT模型。该项目可以使用极小的数据和计算资源,在3小时内训练出一个26M的模型(ps:也许有读者会问,为啥我总是写推理,没有写训练,那显然是我没那个硬件条件呀,嗯,那这会儿这个条件有了。),使大模型技术使用更加简单。MiniMind 支持单机单卡和多卡训练,兼容多个流行的框架,并提供完整的代码和文档支持,帮助初学者和研究者快速上手并进行定制和扩展。MiniMind现在总共有5个模型,最小的是26M,已经有不错的对话能力了。

二、安装环境

模型下载

https://huggingface.co/qihoo360/FancyVideo/tree/main

https://huggingface.co/runwayml/stable-diffusion-v1-5/tree/main

代码下载

git clone https://github.com/jingyaogong/minimind.git

环境安装

docker run --rm -it -v /datas/work/zzq/:/workspace --gpus=all --net host pytorch/pytorch:2.4.0-cuda12.4-cudnn9-devel bash

cd /workspace/MiniMind/minimind

修改requirements.txt包版本

pip install -r requirements.txt -i Simple Index

pip install streamlit -i Simple Index

三、推理测试

修改代码

streamlit run fast_inference.py


http://www.mrgr.cn/news/34033.html

相关文章:

  • 038 进程线程
  • 万字长文解读深度学习——卷积神经网络CNN
  • 【MySQL 保姆级教学】事务的隔离级别(详细)--下(13)
  • MDBook 使用指南
  • HTTP常见的请求头有哪些?都有什么作用?在 Web 应用中使用这些请求头?
  • 深入探讨 MySQL 配置与优化:从零到生产环境的最佳实践20241112
  • HBASE_题库详解
  • 一篇讲完HTML核心内容
  • 面试官:Vue.observable你有了解过吗?说说看
  • 时序建模基础——RevIN
  • 适合新手小白挖掘的高危逻辑漏洞
  • 中欧美三方,理解《人工智能安全治理框架》的特点
  • numpy.dot example
  • 一位架构师的自述:在尚未踏入的世界成为你自己
  • 打印机问题故障处理_十大打印机故障大全及处理方法
  • 干耳屎硬掏不出来怎么办?双十一好用的可视挖耳勺推荐
  • 基于GIS巡检管理系统建设方案(Doc原件参考)
  • 冠珠瓷砖队勇夺第一!超燃绽放城市活力,硬气传承文化大美
  • Springcloud框架-能源管理系统-能源管理系统源码-能源在线监测平台-双碳平台
  • 数据库 - MySQL介绍
  • 黑马智数Day2
  • 在 Postman 中模拟 HTTPS 请求
  • 如何架构蓝图:企业数字化转型的核心指南
  • Spring Boot管理用户数据
  • Vue3:$refs和$parent实现组件通信
  • 按键与库函数