(done) 吴恩达版提示词工程 1. 引言 (Base LLM 和 Instruction Tuned LLM)
url: https://www.bilibili.com/video/BV1Z14y1Z7LJ/?spm_id_from=333.337.search-card.all.click&vd_source=7a1a0bc74158c6993c7355c5490fc600
LLM 有两种:
1.基础 LLM,通过文本训练数据预测后面的内容。
这种 LLM 当你给它提问:What is the capital of France?
它通过文本预测给出的回答可能是:What is France’s largest city?
这种回答对于我们来说没有意义。
2.指令微调模型。这种模型被 fine-tuned 过。
可能经过 RLHF 训练
相比基础 LLM,更有用。
也是我们今天日常使用的 LLM。