当前位置：首页 > news >正文

基于开源大型lmm模型生成标签对InternVL2-1B等轻量lmm模型进行微调

news 2025/3/28 18:52:07

基于开源大型lmm模型生成标签对InternVL2-1B等轻量lmm模型进行微调，提升InternVL2-1B等轻量lmm模型的能力。本实验在window下，基于3060 12g显卡进行实验。基于qwen2-vl 7b模型生成标签（电脑显存大的话可以考虑qwen2-vl 72b模型），然后对InternVL2-1B进行Lora微调。以voc2012_val里面的3000多个图片为训练数据，耗时1小时完成。最后测试微调前后的模型，可以发现微调后的InternVL2-1B模型在特定任务上（目标与数量识别）的能力得到显著增强。

1、依赖库安装

1.1 安装基本依赖

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple optimum
pip install -U transformers
pip install -U qwen_vl_utils
pip install -U modelscope
pip install git+https://github.com/AutoGPTQ/AutoGPTQ
pip install flash-attn

window下安装flash-attn 参考https://hpg123.blog.csdn.net/artic

查看全文

http://www.mrgr.cn/news/45017.html