强化学习不再只是樱桃:预训练也能用强化学习? | 大语言模型训练新范式

猜你喜欢
返回顶部