大语言模型综述与展望

秦小林
qinxl2001@126.com
古徐李弟诚徐海文

中国科学院成都计算机应用研究所中国科学院大学计算机科学与技术学院中国民用航空飞行学院理学院

摘要：大语言模型（LLM）是由具有大量参数（通常数十亿个权重或更多）的人工神经网络组成的一类语言模型，使用自监督学习或半监督学习对大量未标记文本进行训练，是当前生成式人工智能（AI）技术的核心。与传统语言模型相比，LLM通过大量的算力、参数和数据支持，展现出更强的语言理解与生成能力，广泛应用于机器翻译、问答系统、对话生成等众多任务中并表现卓越。现有的综述大多侧重于LLM的理论架构与训练方法，对LLM的产业级应用实践及技术生态演进的系统性探讨仍显不足。因此，在介绍LLM的基础架构、训练技术及发展历程的基础上，分析当前通用的LLM关键技术和以LLM为底座的先进融合技术。通过归纳总结现有研究，进一步阐述LLM在实际应用中面临的挑战，包括数据偏差、模型幻觉和计算资源消耗等问题，并对LLM的持续发展趋势进行展望。

关键词：

大语言模型; 智能体; 自然语言处理; 检索增强生成; 模型幻觉;

专辑：
电子技术及信息科学
专题：
计算机软件及计算机应用; 自动化技术
分类号：
TP391.1;TP18

手机阅读

即刻使用手机阅读

第一步
扫描二维码下载

"移动知网-全球学术快报"客户端

第二步
打开“全球学术快报”

点击首页左上角的扫描图标

第三步
扫描二维码

手机同步阅读本篇文献
下载
- PDF
- CAJ
在线阅读
- 原版阅读
AI辅助阅读

下载手机APP用APP扫此码同步阅读该篇文章

温馨提示：阅读CAJ格式原文，请使用CAJ浏览器。

下载：3360 页码：685-696 页数：12 大小：1776K

大语言模型综述与展望

秦小林
qinxl2001@126.com
古徐李弟诚徐海文

中国科学院成都计算机应用研究所中国科学院大学计算机科学与技术学院中国民用航空飞行学院理学院

即刻使用手机阅读

引文网络

相关推荐

大语言模型综述与展望

秦小林qinxl2001@126.com古徐李弟诚徐海文

中国科学院成都计算机应用研究所 中国科学院大学计算机科学与技术学院 中国民用航空飞行学院理学院

即刻使用手机阅读

引文网络

相关推荐

秦小林
qinxl2001@126.com
古徐李弟诚徐海文

中国科学院成都计算机应用研究所中国科学院大学计算机科学与技术学院中国民用航空飞行学院理学院