基于大语言模型的开源情报摘要生成研究
汪伦艾斯卡尔·艾木都拉张华平耿国桐吕雁飞雷帅
新疆大学计算机科学与技术学院 军事科学院军事科学信息研究中心 北京理工大学计算机学院
摘要:[目的/意义] 大语言模型在生成类文本问题上取得显著进展,为开源情报领域研究人员提供了新思路。将大语言模型应用到开源情报领域,以探索其在该领域的摘要生成能力。[方法/过程] 通过构建开源情报摘要生成数据集,使用Qwen1.5-14B模型为基座模型,并利用LoRA技术对其进行微调训练,得到了Qwen1.5-OSINT模型。[结果/结论] 将Qwen1.5-OSINT模型在开源情报摘要生成任务中与Qwen1.5-14B模型进行对比,结果显示,Qwen1.5-OSINT模型的ROUGE-1指标提升了0.3842,ROUGE-2指标提升了0.2021,ROUGE-L指标提升了0.2494,BLEU指标提升了0.1348。经微调后的模型在多项评价指标上均超越了基座模型,展示了出色的摘要生成能力。[局限] 尽管微调后的Qwen1.5-OSINT模型在效果上有所提升,但其依赖的高质量数据集建设仍需大量的人工投入。此外,模型的泛化能力在不同领域上可能受到限制,需要进一步的研究和探索。
- 专辑:
电子技术及信息科学
- 专题:
计算机软件及计算机应用; 自动化技术; 图书情报与数字图书馆
- 分类号:
G350.7;TP391.1;TP18
中国知网独家网络首发,未经许可,禁止转载、摘编。
相关推荐
- 相似文献
- 读者推荐
- 关联作者
- [1]面向图书自动分类的大语言模型提示学习研究[J]. 戎璐. 图书馆学研究. 2024(01)
- [2]大语言模型技术赋能高校图书馆智慧服务研究[J]. 李雪. 嘉应文学. 2025(03)
- [3]大语言模型在文献检索中的应用研究[J]. 刘双军. 张江科技评论. 2024(10)
- [4]基于大语言模型全流程微调的叙词表等级关系构建研究[J]. 李泽宇,刘伟. 情报理论与实践. 2025(04)
- [5]以大语言模型构建智慧图书馆:框架和未来[J]. 郭利敏,付雅明. 图书馆杂志. 2023(11)
- [6]大语言模型对图书馆数字人文工作的挑战及应对思考[J]. 张宏玲,沈立力,韩春磊,付雅明. 图书馆杂志. 2023(11)
- [7]基于预训练语言模型的互联网开源信息抽取与情报分析应用研究——以“学术、讲座、论坛”等会议活动为例[J]. 王宇琪,周庆山. 情报理论与实践. 2024(01)
- [8]大语言模型赋能图书馆知识服务:基础、模式[J]. 刘长辉. 信息系统工程. 2024(07)
- [9]基于大语言模型知识自蒸馏的无标注专利关键信息抽取[J]. 赵建飞,陈挺,王小梅,冯冲. 数据分析与知识发现. 2024(Z1)
- [10]大语言模型在图书馆采编业务中的应用展望[J]. 刘贝玲,张雨卉. 信息与管理研究. 2024(05)