SFT是监督微调(Supervised Fine-Tun-ing)的缩写。这是一种常见的深度学习策略,通常在预训练的大语言模型上使用。 查看百科
© Baidu 使用百度前必读 百度首页 站内搜索 问题反馈 商务合作 关注微博