编码器:提取语义特征,上下文信息;解码器:生成目标语言;每个单词的词经过编码器后的编码就包括上下文信息
目录
编码器:提取语义特征,上下文信息;
解码器:生成目标语言
为什么需要编码器和解码器
为什么通过解码器的Q和编码器的KV能输出连续答案
上下文向量嵌入什么部位 (每个单词的词经过编码器后的编码就包括上下文信息)
编码器:提取语义特征,上下文信息;
解码器:生成目标语言
Transformer模型包含编码器(Encoder)和解码器(Decoder)两部分,这两部分的存在是为了处理序列到序列(Seq2Seq)的任务,例如机器翻译、文本摘要等。下面我将解释为什么需要这两部分,以及目前主流的Transformer应用和它们分别使用了编码器还是解码器。