文献知网节

基于大语言模型全流程微调的叙词表等级关系构建研究

李泽宇刘伟

  中国科学技术信息研究所  

摘要:[目的/意义]随着知识组织系统运作环境的变化,知识组织的重要性不断提升,为突破传统叙词表构建及应用困境,结合最新大语言模型技术探索叙词表构建新范式。[方法/过程]从叙词表自身特征及其构建思路入手,采用继续预训练、监督微调和强化学习的全流程微调,结合本地知识库的方案,对大语言模型进行微调训练,并基于“量子科技”领域和“理论力学”领域进行实证。[结果/结论]实证发现,经过继续预训练、“多策略数据处理微调方案”和RLHF的微调方案表现更优。其中,对于“理论力学”领域的已有词表等级关系构建准确度高达89.06%,“量子科技”新兴领域词表等级关系构建准确度为63.02%。这表明,本方案可以实现已有词表等级关系的构建,且在新领域词表等级关系的构建中表现良好,具备一定可行性,能为新领域叙词表构建提供参考。 
  • DOI:

    10.16353/j.cnki.1000-7490.2025.04.017

  • 专辑:

    电子技术及信息科学

  • 专题:

    计算机软件及计算机应用; 自动化技术; 图书情报与数字图书馆

  • 分类号:

    TP18;TP391.1;G254.24

下载手机APP用APP扫此码同步阅读该篇文章

温馨提示:阅读CAJ格式原文,请使用CAJ浏览器

下载:832 页码:152-162 页数:11 大小:773K

相关推荐
  • 相似文献
  • 读者推荐
  • 相关法规
  • 关联作者