问题:关于模型训练阶段的描述 答案:B. 有监督微调 (Supervised Fine-Tuning, SFT) 解析: SFT 使用指令-回复的数据对,让仅会续写的基座模型学会按人类指令格式理解与作答。
1、在大型语言模型的三阶段训练流程中,哪一个阶段的主要目标是让模型从一个只会“续写”文本的基座模型,转变为一个能理解并遵循人类指令格式的“对话助手”? {{ select(1) }}
本题属于以下题库,请选择所需题库进行购买
ScanQRCodePrompt
请使用微信扫描下方二维码完成注册