大语言模型对齐研究综述
刘昆麟屈新纪谭芳康红辉赵少伟施嵘
中兴通讯股份有限公司
摘要:随着人工智能技术的飞速发展,大语言模型已在众多领域得到了广泛应用。然而,大语言模型可能会生成不准确、有误导性甚至有害的内容,这引发了人们对大语言模型可靠性的担忧,采用对齐技术来确保大语言模型的行为与人类价值观一致已经成为一个亟待解决的问题。对近年来大语言模型对齐技术的研究进展进行综述。介绍了常用的指令数据收集方法和人类偏好数据集,概述了监督调整和对齐调整的相关研究,讨论了模型评估常用的数据集和方法,总结并展望了未来的研究方向。
- 专辑:
电子技术及信息科学
- 专题:
计算机软件及计算机应用; 自动化技术
- 分类号:
TP18;TP391.1
引文网络
相关推荐
- 相似文献
- 读者推荐
- 关联作者
- [1]基于大语言模型微调的少样本方面级情感分析研究[J]. 朱侯,谭雅文,魏文韬. 现代情报.
- [2]基于大语言模型的开源情报摘要生成研究[J]. 汪伦,艾斯卡尔·艾木都拉,张华平,耿国桐,吕雁飞,雷帅. 情报理论与实践.
- [3]基于大型语言模型的检索增强生成综述[J]. 刘雪颖,云静,李博,史晓国,张钰莹. 计算机工程与应用.
- [4]大语言模型领域意图的精准性增强方法[J]. 任元凯,谢振平. 计算机应用研究. 2024(10)
- [5]大语言模型在教育信息化中的实践:规范、框架与应用[J]. 徐刚,刘志鹏,冯骐,沈富可. 通信学报. 2024(S2)
- [6]基于大语言模型的语料库查询自动生成方法[J]. 张成辉,罗景,涂新辉,陈雨霖. 计算机工程.
- [7]基于思维代码的大语言模型多工具协调调用提示方法[J]. 江志英,黄震宇,宋晨炜,张泽宇,韩众和,谷伟伟,龚启航,刘思叶,赵妍. 北京化工大学学报(自然科学版).
- [8]大语言模型的偏见挑战:识别、评估与去偏[J]. 徐月梅,叶宇齐,何雪怡. 计算机应用.
- [9]农业大语言模型的部署及应用开发探索[J]. 刘铮,朱轶. 中国农业文摘-农业工程.
- [10]基于深度预训练语言模型的文献学科自动分类研究[J]. 罗鹏程,王一博,王继民. 情报学报. 2020(10)