当前位置: 首页 > news >正文

DeepSeek大语言模型下几个常用术语

昨天刷B站看到复旦赵斌老师说的一句话“科幻电影里在人脑中植入芯片或许在当下无法实现,但当下可以借助AI人工智能实现人类第二脑”(大概是这个意思)

💞更多内容,可关注公众号“ 一名程序媛 ”,我们一起从 0 - 1 学编程💞

基本概念

  • AI 人工智能
  • NLP 自然语言处理
  • LLM 大语言模型
  • Hugging Face 一个提供了丰富的预训练模型和工具库的平台网站
  • Ollama 开源的本地大语言模型运行框架,用来在本地部署调用大语言模型,如DeepSeek-R1
  • vLLM 一个专注于高性能LLM推理的工具,也可以调用大语言模型,还可作模型文件转化或量化操作
  • llama.cpp 基于纯C/C++实现的高性能大语言模型推理引擎,专为优化本地及云端部署而设计,上面的Ollama即是在此基础上的封装和优化
  • Chatbox 为大语言模型对话提供人机界面交互功能,当然也可使用纯命令行方式,随个人喜好

量化

一种通过降低模型参数的表示精度来减少模型大小和计算需求的方法

常用的模型文件格式

  • safetensors - 由 Hugging Face 推出的一种新型安全模型存储格式,特别关注模型安全性、隐私保护和快速加载,仅包含张量的文件格式 ,如model-00001-of-000002.safetensors
  • GGUF All-in-one 二进制模型文件 ,如DeepSeek-R1-Distill-Qwen-7B-Q3_K_L.gguf
    • Q(Quantization)量化(压缩),后面的数值表示“单个参数的平均bit数”,数值越大越智能
    • K(K Quant)即多个参数组合一Block做压缩,初衷是在同一个压缩级别上再补偿些精度回来
    • S L M 等用于区分混合精度的程度,字母顺序越小越精简

💞更多内容,可关注公众号“ 一名程序媛 ”,我们一起从 0 - 1 学编程💞

在这里插入图片描述


http://www.mrgr.cn/news/93940.html

相关文章:

  • 创建Electron35 + vue3 + electron-builder项目,有很过坑,记录过程
  • 【模拟CMOS集成电路设计】带隙基准(Bandgap)设计与仿真(基于运放的电流模BGR)
  • 从0开始的操作系统手搓教程43——实现一个简单的shell
  • 【SpringMVC】深入解析@ RequestMapping 注解的概念及使用和 MVC 介绍
  • QT多线程
  • 代码随想录刷题day41|(二叉树篇)二叉树的最大深度(递归)
  • 【前端】BOM DOM
  • 打造智能钉钉机器人:借助智谱GLM-4-Flash实现高效智能回复(文末附源码)
  • 打造智能聊天体验:前端集成 DeepSeek AI 助你快速上手
  • 我的AI工具箱Tauri版-建筑平面图生成装修设计
  • 个人学习编程(3-10) 刷题
  • Jetson Orin 安装 onnxruntime
  • LSTM方法实践——基于LSTM的汽车销量时序建模与预测分析
  • 基金股票期权期货投资方式对比
  • 软考 数据通信基础——信道
  • 【SoC基础】第2节:CPU简介
  • DeepSeek本地化部署与跨域访问架构构建
  • ngx_regex_create_conf
  • 多视图几何--相机标定--从0-1理解张正友标定法
  • 【Go每日一练】统计字符出现的次数