当前位置: 首页 > news >正文

基于Python的自然语言处理系列(50):Soft Prompt 实现

        在本篇文章中,我们将实现一个简单的 Soft Prompt 技术,该技术允许我们仅微调新增的嵌入权重,而保持预训练模型不变。Soft Prompt 的主要优势在于它的参数高效性,使得模型在特定任务上快速适应,而无需重新训练模型的所有权重。

1. Soft Prompt 概述

        Soft Prompt 技术来源于论文 The Power of Scale for Parameter-Efficient Prompt Tuning。它通过在模型输入嵌入层添加可训练的软提示嵌入(soft prompt embeddings),使得我们可以仅微调这些新增嵌入,达到适应新任务的目的。这种方法不仅保留了原始模型的完整性,还大幅减少了训练所需的参数和时间成本。

2. 加载 GPT2 模型

        我们首先加载预训练的 GPT2 语言模型,并检查其原始的输入嵌入。

from transformers import GPT2LMHeadModel, GPT2TokenizerFast
import os
import torch
import torch.nn as nn# 设置代理(如果需要)
os.environ['http_proxy'

http://www.mrgr.cn/news/63090.html

相关文章:

  • 成都睿明智科技有限公司抖音电商服务的领航者
  • 【安全性分析】正式安全分析与非正式安全分析
  • 第72期 | GPTSecurity周报
  • InstructIR: High-Quality Image Restoration Following Human Instructions 论文阅读笔记
  • Unity Editor 快速移动资源
  • Java阶段三02
  • IEC104规约的秘密之十九----6号文中的一些问题
  • IDEA修改生成jar包名字的两种方法实现
  • 前端八股文第八篇
  • Vue v-on 简写 @, v-bind 简写 :
  • Vue v-html v-once v-if
  • 定制化视频生成新模范!零样本主体驱动,精确运动控制!复旦阿里等发布DreamVideo-2
  • 消息队列面试——打破沙锅问到底
  • 2024最新IntelliJ IDEA常用的小技巧汇总,JAVA 新手上路必备
  • 【Oracle APEX开发小技巧10】CSS样式控制交互式报表列宽和自动换行效果
  • Nginx 实现动态封禁IP,详细教程来了
  • 详细分析Vue3中的provide和inject基本知识(附Demo)
  • 华为OD机试 - 字符串消除 - 栈Stack(Python/JS/C/C++ 2024 C卷 100分)
  • 【Rust标准库中的convert(AsRef,From,Into,TryFrom,TryInto)】
  • wordpress argon主题美化方面
  • 查看VPC之间的互访流量
  • (C#面向初学者的 .NET 的生成 AI) 第 1 部分-简介
  • STM32(hal库)中Systick是如何默认进行计时1ms的?
  • 2024年【广东省安全员C证第四批(专职安全生产管理人员)】新版试题及广东省安全员C证第四批(专职安全生产管理人员)复审考试
  • C语言函数指针实用总结
  • 存在sql注入的公网站点