当前位置: 首页 > news >正文

推理框架SGLang安装与调试

SGLang的安装和调试

SGLang是一个用于大型语言模型和视觉语言模型的快速服务框架。
SGLang Docs
SGLang源码安装手册

我的环境

Linux + conda + cuda12.6 + python3.12 + 4* GeForce RTX 3090

安装

(安装torch2.5是为了和sglang对齐,cuda向后兼容)

git clone git@github.com:gitover22/sglang.git
cd sglang
conda create -n sglang
conda activate sglang
conda install python=3.12
pip install --upgrade pip
conda install pytorch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 pytorch-cuda=12.4 -c pytorch -c nvidia 
pip install -e "python[all]" --find-links https://flashinfer.ai/whl/cu124/torch2.5/flashinfer-python

调试

程序路径:examples/frontend_language/quick_start/local_example_chat.py
配置launch.json:

{"configurations": [{"name": "Python Debugger: Current File","type": "debugpy","request": "launch","program": "${file}","console": "integratedTerminal"}]
}

可以愉快的进行debug啦!

在这里插入图片描述

重构代码后执行以下命令重新安装sglang

pip install -e "python[all]"

http://www.mrgr.cn/news/94253.html

相关文章:

  • LVS + Keepalived 高可用集群
  • 《YOLOE: Real-Time Seeing Anything》论文速览翻译,支持文本提示,视觉提示等开放世界检测算法!
  • Java常见的并发设计模式
  • maven wrapper的使用
  • 爬虫中一些有用的用法
  • Qt:绘图API
  • 【Pytorch Transformers Fine-tune】使用BERT进行情感分类任务微调
  • Selenium 自动化测试学习总结
  • 本地Git仓库搭建(DevStar)与Git基本命令
  • MySQL的安装与建表
  • PySide(PyQT)的mouseMoveEvent()和hoverMoveEvent()的区别
  • java中小型公司面试预习资料(四):微服务架构
  • Unity 封装一个依赖于MonoBehaviour的计时器(上) 基本功能
  • Visual Studio 安装及使用教程(Windows)【安装】
  • JavaScript_Day2
  • 江科大51单片机笔记【16】AD/DA(上)
  • 环境配置 | 5分钟极简Git入门:从零上手版本控制
  • IP 地址
  • ROS实践(四)机器人建图(gmapping)
  • 3.数据结构-串、数组和广义表