文献知网节
印刷版

大语言模型增强下的社媒平台热榜主题分析

郑文镇唐锡晋

xjtang@iss.ac.cn

  中国科学院数学与系统科学研究院    中国科学院大学  

摘要:社交媒体平台的热门榜单作为热点信息的汇聚和展示,对于我们理解当前热点话题具有很大的启示.但由于热榜文本存在词汇稀疏和文本较短的问题,传统LDA和基于神经网络的主题挖掘模型面临着主题聚合表现不佳的表现.对此,文章提出了一个基于大型语言模型增强的主题建模框架——STAB.该框架结合大语言模型对文本数据的生成式增强能力,以及文档嵌入在主题建模中的优异表现,能够在短文本数据集上挖掘出有意义的主题.在多个数据集上的实验结果表明,在通用客观评价指标和下游任务应用方面,该框架均优于已有的主题建模方法. 
  • 专辑:

    理工A(数学物理力学天地生); 电子技术及信息科学

  • 专题:

    计算机软件及计算机应用; 自动化技术

  • 分类号:

    TP391.1;TP18

下载手机APP用APP扫此码同步阅读该篇文章

温馨提示:阅读CAJ格式原文,请使用CAJ浏览器

下载:798 页码:1630-1648 页数:19 大小:1727K

相关推荐
  • 相似文献
  • 读者推荐
  • 相关法规
  • 关联作者