文献知网节

一种基于汉字笔顺特征的关键词变体匹配方法

王红雨杜刚朱艳云张晨杜雪涛

  中国移动通信集团设计院有限公司  

摘要:近年来,垃圾短消息呈现出包含大量拆分字和形近字的现象,这种短消息可以绕过监控系统的关键词审查。由于拆分字和形近字数量众多,变化灵活,将其全部加入关键词库将令关键词库变得冗余。对此,本文提出了一种基于汉字笔顺特征的关键词变体匹配方法。基于汉字笔顺特征,首先合并垃圾短消息中的拆分字;然后通过建立索引表,快速查找出短消息中包含的疑似关键词;最后提出了"金字塔匹配法"匹配关键词。本文提出的方法有效降低了关键词库的冗余度,提高了关键词匹配效率。 
  • DOI:

    10.13992/j.cnki.tetas.2020.12.003

  • 专辑:

    电子技术及信息科学; 哲学与人文科学

  • 专题:

    中国语言文字; 计算机软件及计算机应用

  • 分类号:

    TP391.1;H122

下载手机APP用APP扫此码同步阅读该篇文章

温馨提示:阅读CAJ格式原文,请使用CAJ浏览器

下载:77 页码:14-18 页数:5 大小:3130K

相关推荐
  • 相似文献
  • 读者推荐
  • 相关法规
  • 关联作者