Training language models to follow instructions with human feedback

Training language models to follow instructions with human feedback [英文] [申请下载]

上传于 2023-02-13 11:47 阅读：544 次 标签：学术论文 OpenAI 强化学习 评论

Long Ouyang, Jeff Wu, Xu Jiang, Diogo Almeida, Carroll L. Wainwright, Pamela Mishkin, Chong Zhang, Sandhini Agarwal, Katarina Slama, Alex Ray, John Schulman, Jacob Hilton, Fraser Kelton, Luke Miller, Maddie Simens, Amanda Askell, Peter Welinder, Paul Christiano, Jan Leike, Ryan Lowe

您不能发表评论，可能是以下原因: 登录后才能评论

Training language models to follow instructions with human feedback [英文] [申请下载]

选择可以下载文件的用户

文档评论