当前位置: 首页 > news >正文

ChatGLM 微调复现

GPU 2080Ti

文章目录

  • 开源仓库
  • 复现细节
  • 报错解决

开源仓库

  • ChatGLM-6B
  • ChatGLM2-6B
  • ChatGLM3-6B

复现细节

  • 模型文件下载:第五篇-ChatGLM2-6B|ChatGLM3-6B模型下载
  • 安装依赖:pip install datasets rouge_chinese nltk transformers[torch] sentencepiece cpm_kernels jieba
  • Linux下sh文件执行权限不够,该怎么做:chmod u+x *.sh对当前目录下的file.sh文件的所有者增加可执行权限。
  • /ptuning目录下新建子目录output为模型输出目录。
  • DeepSpeed配置
    • deepspeed + p-tuning v2 微调:Chatglm-6B+Deepspeed+PTuningv2 多卡高效微调
    • chatglm2 的 deepspeed 多卡微调(ptuning)
    • ChatGLM-6B微调实践与问题汇总(fine-tune+p-tuning+知识遗忘解决尝试)

报错解决

  • torchrun: error: unrecognized arguments: --nproc-per-node=1,修改--nproc-per-node=$NUM_GPUS--nproc_per_node=$NUM_GPUS
  • deepspeed使用zero3 + offload报错:AttributeError: ‘DeepSpeedCPUAdam‘ object has no attribute ‘ds_opt_adam,在执行代码前加上DS_SKIP_CUDA_CHECK=1 ./ds_train_finetune.sh
  • TypeError: deepspeed_init() got an unexpected keyword argument ‘resume_from_checkpoint’,降级安装pip install transformers==4.29.2
  • ImportError: cannot import name 'default_hp_search_backend' from 'transformers.integrations',降级安装pip install transformers==4.29.2
  • TypeError: __init__() got an unexpected keyword argument 'use_auth_token',降级安装pip install datasets=2.19.1

可以参考的另一个项目,但一直提示显存不够用,不知道该怎么调。


http://www.mrgr.cn/news/44624.html

相关文章:

  • 【大数据】Flink CDC 实时同步mysql数据
  • 【Python进阶】Python中的操作系统接口:使用os模块进行系统调用
  • 自然语言处理:第五十一章 LangChain面经
  • RGB转HDMI方案——FPGA学习笔记20
  • 运用MinIO技术服务器实现文件上传——利用程序上传图片(二 )
  • 小乐乐与欧几里得
  • 不信?这4款在线剪辑工具,让音频作品秒变专业级
  • 进程间通信——《匿名管道》
  • Nuxt.js 应用中的 link:prefetch 钩子详解
  • 医院管理智能化:Spring Boot技术革新
  • 攻防世界 告诉你个秘密
  • 黑马JavaWeb开发跟学(十二)SpringBootWeb案例
  • EventSource是什么,和axios区别,以及SSE是什么
  • C++ : STL容器之string剖析
  • Java中参数传递:按值还是按引用?
  • 如何保证下订单和扣款操作只能执行一次:技术详解
  • 通俗‌易懂的Paxos算法
  • 2024双十一有什么值得买的好物?力荐五款好用不踩雷的好物推荐!
  • Pandas -----------------------基础知识(八)
  • 苍穹外卖学习笔记(十六)