大语言模型对齐研究综述

刘昆麟屈新纪谭芳康红辉赵少伟施嵘

中兴通讯股份有限公司

摘要：随着人工智能技术的飞速发展，大语言模型已在众多领域得到了广泛应用。然而，大语言模型可能会生成不准确、有误导性甚至有害的内容，这引发了人们对大语言模型可靠性的担忧，采用对齐技术来确保大语言模型的行为与人类价值观一致已经成为一个亟待解决的问题。对近年来大语言模型对齐技术的研究进展进行综述。介绍了常用的指令数据收集方法和人类偏好数据集，概述了监督调整和对齐调整的相关研究，讨论了模型评估常用的数据集和方法，总结并展望了未来的研究方向。

关键词：

大语言模型; 对齐技术; 调整; 强化学习;

专辑：
电子技术及信息科学
专题：
计算机软件及计算机应用; 自动化技术
分类号：
TP18;TP391.1

手机阅读

即刻使用手机阅读

第一步
扫描二维码下载

"移动知网-全球学术快报"客户端

第二步
打开“全球学术快报”

点击首页左上角的扫描图标

第三步
扫描二维码

手机同步阅读本篇文献
下载
- PDF
- CAJ
在线阅读
- HTML阅读
- 原版阅读
AI辅助阅读

下载手机APP用APP扫此码同步阅读该篇文章

温馨提示：阅读CAJ格式原文，请使用CAJ浏览器。

下载：1061 页码：173-194 页数：22 大小：1601K

文章目录

大语言模型对齐研究综述

刘昆麟屈新纪谭芳康红辉赵少伟施嵘

中兴通讯股份有限公司

即刻使用手机阅读

引文网络

相关推荐