大语言模型增强下的社媒平台热榜主题分析
郑文镇唐锡晋
中国科学院数学与系统科学研究院 中国科学院大学
摘要:社交媒体平台的热门榜单作为热点信息的汇聚和展示,对于我们理解当前热点话题具有很大的启示.但由于热榜文本存在词汇稀疏和文本较短的问题,传统LDA和基于神经网络的主题挖掘模型面临着主题聚合表现不佳的表现.对此,文章提出了一个基于大型语言模型增强的主题建模框架——STAB.该框架结合大语言模型对文本数据的生成式增强能力,以及文档嵌入在主题建模中的优异表现,能够在短文本数据集上挖掘出有意义的主题.在多个数据集上的实验结果表明,在通用客观评价指标和下游任务应用方面,该框架均优于已有的主题建模方法.
- 专辑:
理工A(数学物理力学天地生); 电子技术及信息科学
- 专题:
计算机软件及计算机应用; 自动化技术
- 分类号:
TP391.1;TP18
引文网络
相关推荐
- 相似文献
- 读者推荐
- 关联作者
- [1]大语言模型在无锚题等值中的应用——以阅读素养测评为例[J]. 杜君磊,郑勤华,宋义深. 武汉大学学报(理学版).
- [2]基于大语言模型的语料库查询自动生成方法[J]. 张成辉,罗景,涂新辉,陈雨霖. 计算机工程.
- [3]基于大语言模型的人文社会科学汉英机器翻译研究[J]. 孙光耀,赵志枭,沈思,王东波. 数据分析与知识发现.
- [4]基于译文易错词纠正机制的大语言模型机器翻译[J]. 李博,季佰军,段湘煜. 计算机工程.
- [5]基于思维代码的大语言模型多工具协调调用提示方法[J]. 江志英,黄震宇,宋晨炜,张泽宇,韩众和,谷伟伟,龚启航,刘思叶,赵妍. 北京化工大学学报(自然科学版).
- [6]基于大语言模型微调的少样本方面级情感分析研究[J]. 朱侯,谭雅文,魏文韬. 现代情报.
- [7]大语言模型的偏见挑战:识别、评估与去偏[J]. 徐月梅,叶宇齐,何雪怡. 计算机应用.
- [8]基于大语言模型和事件融合的电信诈骗事件风险分析[J]. 斯彬洲,孙海春,吴越. 数据分析与知识发现.
- [9]面向闭源大语言模型的增强研究综述[J]. 刘华玲,张子龙,彭宏帅. 计算机科学与探索.
- [10]大语言模型赋能“问题与方法”学术图谱构建与应用研究[J]. 刘启刚,王尹凡,牟立峰,徐伟,孙向阳. 数据分析与知识发现.