当前位置: 首页 > news >正文

大模型应用开发大纲

AI大模型学习路径脑图结构

一、AI及LLM基础

学习目标:建立对AI和LLM的基础理解,了解主要的机器学习和神经网络模型,掌握API调用方法。

  • 1.1 AI领域基础概念
    • AI, NL/NLU/NLG
    • 机器学习: 学习方法, 拟合评估
    • 神经网络: CNN, RNN, Transformer
    • Transformer, BERT架构简介
    • LLM, Generative AI
    • OpenAI及其他常用大模型介绍
    • 参数详解
    • API Key OpenAI API调用
  • 1.2 OpenAI开发
    学习目标:学会使用OpenAI API开发聊天机器人,理解API的参数和计费,掌握不同API调用方法。
    • OpenAI API参数, Token, 计费
    • Rest API调用(Postman)
    • Python API调用
    • 开发控制台循环聊天
    • 管理对话token
  • 1.3 支持多模态输入的AI Chatbot App
    学习目标:开发支持图片等多模态输入的Chatbot应用,优化代码结构以提高开发效率。
    • 开发基于Streamlit和OpenAI大模型的Chatbot App
    • 支持图片的多模态输入
    • Python项目代码结构优化
  • 1.4 Prompt Engineering提示词工程
    学习目标:学习如何设计高效的Prompt以获得最佳模型输出结果,深入掌握Prompt Engineering技巧,提升与大模型的交互质量。
    • Prompt engineering介绍
    • 最佳实践
    • Zero-shot, Few-shot, CoT, ReAct, Reflexion
    • Prompt Chaining
    • 结构化输出

二、LangChain开发

学习目标:掌握LangChain的高级工具与RAG 和Agent技术,能够构建复杂的AI应用。

  • 2.1 LangChain基础
    学习目标:掌握LangChain的基本用法,理解如何在复杂任务中使用该框架
    • LangChain模块和体系
    • LLM & Chat models
    • PromptTemplates, OutputParses, Chains
    • LLM apps debug
  • 2.2 LangChain Chat Model
    学习目标:能够使用LangChain开发具有记忆功能的Chatbot。
    • Prompt templates: Few shot
    • 为Chain添加Message history (Memory)
    • 基于LangChain的Chatbot
  • 2.3 LangChain Tools & Agent
    学习目标:深入学习LangChain的工具和Agent,包括数据处理、任务管理、插件使用等。
    • Multimode集成
    • Ouput parsers: JSON, XML, YAML
    • 自定义Tools, 调用Tools
    • 创建和运行Agent
  • 2.4 Embedding & Vector Store
    学习目标:掌握如何使用Embedding模型和向量数据库进行高效的信息检索
    • Embedding models
    • Vector stores向量数据库
    • 基于LangChain构建向量存储和查询
  • 2.5 RAG专题
    学习目标:理解RAG工作机制,学会使用文档加载器和文本分割器处理数据,学习如何结合检索和生成模型来处理复杂的任务。
    • RAG简介
    • Document loaders & Text splitters
    • Loader, Splitter, Embedding等综合应用
  • 2.6 自定义组件专题
    学习目标:掌握回调处理和自定义模型的开发。学会自定义组件以满足特定需求,增强模型的灵活性和功能性。
    • Callback 处理
    • 自定义 callback handlers
    • 自定义 Chat model
    • 自定义 RAG: Retriever, document loader
  • 2.7 基于LangChain的常用案例实战
    学习目标:掌握使用LangChain处理实际问题的方法,包括文档问答、数据查询和集成网络搜索功能
    • PDF 文档问答
    • 基于 Web URL 的问答
    • 基于 SQL 的 CSV 数据分析问答
      Web Search 集成
  • 2.8 带RAG的Chatbot实战
    学习目标:构建一个具有复杂对话记录处理能力的Chatbot。
    • Chatbot Memory, RAG, Tools 大对话记录处理
  • 2.9 LangGraph开发实战
    学习目标:掌握LangGraph的应用,理解如何通过图结构来增强模型的推理能力,学会构建复杂的多智能体系统。
    • LangGraph 核心组件: Graphs, State, Nodes, Edges, Send…
    • LangGraph 实现:可控性 Agent 框架, 持久化, Human-in-the-loop, streaming, React agent
    • Agent 使用案例: Chatbots, Multi-Agent Systems, RAG, Planning Agent…

三、LlamaIndex开发

  • 3.1 LlamIndex框架
    学习目标:掌握LlamaIndex的核心模块和应用构建。
    • 与 LangChain 框架对比
    • 核心模块介绍: Models, Prompts, Loading, Indexing, Storing, Quering, Agent, Evaluation
    • RAG pipeline 构建: Loading, Indexing, Querying, Evaluating Agent 构建
  • 3.2 基于LlamIndex框架的应用
    学习目标:基于LlamaIndex框架开发大规模文本搜索和内容推荐系统。
    • 大规模文本数据搜索内容推荐
    • AI 问答
    • LlamaIndex 与 LangChain 集成
    • LlamaIndex RAG CLI 工具

四、AutoGen开发

  • 4.1 AutoGen Studio
    • AutoGen Studio UI
    • Python集成workflow
  • 4.2 AutoGen Framework
    • 快速入门
    • LLM配置
    • Agent类型与Code Executors自动化代码

五、LLM大模型训练与微调

学习目标:具备大模型的训练与调优能力,能够开发和优化适用于特定领域的AI模型

  • 5.1 模型即服务共享平台
    学习目标:学会使用共享平台和本地环境开发和部署大型语言模型。
    • Hugging Face, ModelScope 平台功能
    • 加载在线模型, 离线模型
    • 模型推理调用
    • Transformers 使用,利用模型完成任务:文本,语音,Embedding Models
  • 5.2 私有部署本地大模型
    学习目标:掌握本地大模型的安装部署和调用
    • 硬件配置分析(推理和微调)
    • 常用大模型选型: LlaMA 3, Gemma, Mistral…
    • 本地大模型安装部署
    • 本地大模型调用
    • 本地大模型与对话 APP 应用集成
  • 5.3 训练自己的大模型
    学习目标:深入理解Transformer模型的工作原理,掌握大模型的训练流程和评估,量化技术。
    • Transformer 模型详解, Encoder, Decoder
    • 制作和加载数据集(训练、验证、测试)
    • 模型训练Train (单卡, 多卡),分布式训练
    • 模型评估:方法论、评估指标
    • 模型量化: AWQ, GPTQ, GGUF
    • 模型部署
    • API 调用
  • 5.4 大模型微调
    学习目标:掌握基于预训练模型的微调技术,针对特定领域进行模型的训练与优化,构建专属行业模型。
    • 构建专属行业模型: 基于预训练大模型 Fine-tune
    • 微调对比: 提示工程, RAG, Fine-tuning 对比
    • Prompt Tuning, Prefix-Tuning, LoRA, QLoRA
    • 基于 OpenAI Fine-tuning
    • 本地大模型的 Fine-tuning
    • 特定任务的大模型推理和训练实践: 文本分类, 序
    • 列标注, 文本生成, 图像分割
  • 5.5 特定任务的模型微调训练
    • 基于BERT的中文评价情感分析
    • 如何处理超长文本训练问题
    • GPT2-中文生成模型定制化微调训练
    • GPT2-中文生成模型定制化内容输出
    • LlaMA3大模型本地部署与调用
    • 使用自定义数据集和LlaMA-Factory完成LlaMA3微调训练
    • LlaMA3 LoRA微调测试评估、模型合并、量化
    • LoRA微调后的模型部署
  • 5.6 多模态大模型使用
    • 多模态大模型基本概念
    • 本地部署CogVideoX-5B文生视频模型
    • Llama 3.2-Vision模型架构剖析
    • Llama 3.2-Vision模型预期用途
    • 使用ollama部署Llama-3.2-11B-Vision-InstructGGUF实现视觉问答

六 企业级项目实战

学习目标:通过企业级真实项目场景落地,锤炼大模型全栈技术应用能力。完成AI应用从策划到开发到落地的全过程。

  • RAG项目实战(基于 LlamaIndex 构建企业私有知识库)
  • 基于本地大模型的在线心里问诊系统(微调项目)
  • 六 企业级项目实战

学习目标:通过企业级真实项目场景落地,锤炼大模型全栈技术应用能力。完成AI应用从策划到开发到落地的全过程。

  • 基于 LlamaIndex 构建企业私有知识库(RAG项目实战)
  • 基于本地大模型的在线心里问诊系统(微调项目)
  • 基于YOLO的骨龄识别项目(视觉项目)
  • 企业业招标采购客服系统(RAG+微调项目)
  • 基于大模型的语音唤醒项目实战

七 MCP 接口统一协议

  • mcp 技术入门实战
  • mcp技术入门介绍
  • Funtion calling 和agent 和MCP的区别
  • mcp客户端client介绍和创建
  • mcp服务端端介绍和创建
  • client接入server流程
  • 实时查询天气查询开发
  • mcp生态介绍
  • mcp生生产项目1-通过接口文档生产代码
  • mcp 生产生产生产项目2 -自然语言查询操作数据库mysql

http://www.mrgr.cn/news/99228.html

相关文章:

  • Java学习路线--自用--带链接
  • TensorBoard如何在同一图表中绘制多个线条
  • 【项目管理】成本类计算 笔记
  • 开源身份和访问管理(IAM)解决方案:Keycloak
  • 软件工程师中级考试-上午知识点总结(下)
  • Mininet--nodelib.py源码解析
  • Novartis诺华制药社招入职综合能力测评真题SHL题库考什么?
  • 每日一题——数据中心网络地址规划
  • Oracle数据库和PLSQL安装配置
  • MongoDB数据库的安装到入门使用详细讲解
  • C++笔记-list
  • 【深度学习】计算机视觉(17)——ViT理解与应用
  • day47—双指针-平方数之和(LeetCode-633)
  • 从零开始搭建PyTorch环境(支持CUDA)
  • 【ARM64】【cache/MMU】学习总结
  • day45—贪心-非递减数列(LeetCode-665)
  • 【MySQL数据库入门到精通-02SQL分类以及DDL操作】
  • PFLM: Privacy-preserving federated learning with membership proof证明阅读
  • 【CentOs】构建云服务器部署环境
  • Ubuntu Linux 中文输入法默认使用英文标点