文献知网节
(录用定稿)网络首发时间:2025-02-14 15:38:39

基于大语言模型的开源情报摘要生成研究

汪伦艾斯卡尔·艾木都拉张华平耿国桐吕雁飞雷帅

  新疆大学计算机科学与技术学院    军事科学院军事科学信息研究中心    北京理工大学计算机学院  

摘要:[目的/意义] 大语言模型在生成类文本问题上取得显著进展,为开源情报领域研究人员提供了新思路。将大语言模型应用到开源情报领域,以探索其在该领域的摘要生成能力。[方法/过程] 通过构建开源情报摘要生成数据集,使用Qwen1.5-14B模型为基座模型,并利用LoRA技术对其进行微调训练,得到了Qwen1.5-OSINT模型。[结果/结论] 将Qwen1.5-OSINT模型在开源情报摘要生成任务中与Qwen1.5-14B模型进行对比,结果显示,Qwen1.5-OSINT模型的ROUGE-1指标提升了0.3842,ROUGE-2指标提升了0.2021,ROUGE-L指标提升了0.2494,BLEU指标提升了0.1348。经微调后的模型在多项评价指标上均超越了基座模型,展示了出色的摘要生成能力。[局限] 尽管微调后的Qwen1.5-OSINT模型在效果上有所提升,但其依赖的高质量数据集建设仍需大量的人工投入。此外,模型的泛化能力在不同领域上可能受到限制,需要进一步的研究和探索。 
  • 专辑:

    电子技术及信息科学

  • 专题:

    计算机软件及计算机应用; 自动化技术; 图书情报与数字图书馆

  • 分类号:

    G350.7;TP391.1;TP18

中国知网独家网络首发,未经许可,禁止转载、摘编。

下载手机APP用APP扫此码同步阅读该篇文章

温馨提示:阅读CAJ格式原文,请使用CAJ浏览器

下载:833 页数:8 大小:783K

相关推荐
  • 相似文献
  • 读者推荐
  • 相关法规
  • 关联作者