启智平台华为昇腾910B 运行DeepSeek Janus-Pro-7/1B
最近看到华为官方Janus-Pro-模型库-ModelZoo-昇腾社区的模型库提供了Janus在昇腾平台的部署指南,按照指南进行操作在昇腾平台上成功跑通了Janus的图片理解以及文字生图。
我已经在启智平台上选好了OpenMind-CANN8的镜像,内部已经安装好了npu驱动以及CANN加速包。
首先需要git clone 官方的代码文件,并且进入Janus-pro的目录
git clone https://gitee.com/ascend/ModelZoo-PyTorch.git
cd ModelZoo-PyTorch/MindIE/MultiModal/Janus-Pro
然后需要运行下述指令安装需求包以及torch-npu
pip install -r requirements.txt
pip install torch-npu
pip install -e .
修改inference.py中的user内容以及image路径后,可以运行
python inference.py --path '/home/ma-user/work/pretrainmodel/Janus-Pro-7B' --device_id 0 --type bf16
实现图片内容理解的功能
运行下述的generation_inference.py代码进行文字生图的功能,可以修改py文件中的文字信息生成不同的图像
python generation_inference.py --path '/home/ma-user/work/pretrainmodel/Janus-Pro-7B' --device_id 0 --type bf16