下载百度汉语App
名师好课免费看

SFT

百科释义

报错

SFT是监督微调(Supervised Fine-Tun-ing)的缩写。这是一种常见的深度学习策略,通常在预训练的大语言模型上使用。 查看百科

注:百科释义来自于百度百科,由网友自行编辑。