人类反馈引导:ChatGPT训练实现用户意图对齐

需积分: 2 13 下载量 140 浏览量 更新于2024-06-27 2 收藏 1.71MB PDF 举报
身份认证 购VIP最低享 7 折!
领优惠券(最高得80元)