基于预训练语言模型的互联网开源信息抽取与情报分析应用研究——以“学术、讲座、论坛”等会议活动为例
王宇琪周庆山
北京大学信息管理系
摘要:[目的/意义]互联网开源信息具有海量、多源异构等特点,如何从中及时发现有价值的信息,并对信息加以情报利用一直是情报研究和实践应用的重点领域之一。文章提出一套开源的学术会议领域信息抽取框架,解决信息抽取语义理解和关联融合的问题,并将其应用于情报研究中,为解决情报分析的智能应用提供工具和方法。[方法/过程]采集网络上新闻报道的内容,采用预训练语言模型方法挖掘学术会议事件信息,提出面向特定领域的信息抽取框架,实现会议名称及其举办时间、地点、出席人、发言人信息的抽取,并进行实际的情报利用研究案例分析。[结果/结论]相较于单一抽取实体的方法,抽取会议核心元素更具有情报关联性和准确性,可以更好地对开源热点事件发现和跟踪监测、目标人物轨迹动向分析等研究提供方法,为情报分析应用和情报研判奠定基础。
- DOI:
10.16353/j.cnki.1000-7490.2024.01.019
- 专辑:
电子技术及信息科学
- 专题:
计算机软件及计算机应用; 自动化技术; 图书情报与数字图书馆
- 分类号:
TP391.1;TP18;G350.7
引文网络
相关推荐
- 相似文献
- 读者推荐
- 关联作者
- [1]基于大语言模型的开源情报摘要生成研究[J]. 汪伦,艾斯卡尔·艾木都拉,张华平,耿国桐,吕雁飞,雷帅. 情报理论与实践.
- [2]基于大语言模型全流程微调的叙词表等级关系构建研究[J]. 李泽宇,刘伟. 情报理论与实践. 2025(04)
- [3]以大语言模型构建智慧图书馆:框架和未来[J]. 郭利敏,付雅明. 图书馆杂志. 2023(11)
- [4]大语言模型对图书馆数字人文工作的挑战及应对思考[J]. 张宏玲,沈立力,韩春磊,付雅明. 图书馆杂志. 2023(11)
- [5]面向图书自动分类的大语言模型提示学习研究[J]. 戎璐. 图书馆学研究. 2024(01)
- [6]大语言模型赋能图书馆知识服务:基础、模式[J]. 刘长辉. 信息系统工程. 2024(07)
- [7]基于大语言模型知识自蒸馏的无标注专利关键信息抽取[J]. 赵建飞,陈挺,王小梅,冯冲. 数据分析与知识发现. 2024(Z1)
- [8]大语言模型在图书馆采编业务中的应用展望[J]. 刘贝玲,张雨卉. 信息与管理研究. 2024(05)
- [9]大语言模型在智慧图书馆中的应用与挑战[J]. 姚佳呈,许鑫. 信息与管理研究. 2024(05)
- [10]面向高校图书馆智慧服务的大语言模型探索性研究——以命名实体识别任务为例[J]. 刘思得,李东升. 现代情报. 2024(12)