文献知网节

古籍文本结构化、知识体系化、利用智能化的实践探索——以璇琮数字人文智慧平台的设计与建设为例

李飞跃郝若辰朱厚权

  清华大学人文学院    元引科技公司  

摘要:清华大学“璇琮数字人文智慧平台”由针对古籍自动整理与知识挖掘的文本工具系统、协助研究与创作的诗歌智能分析系统以及包含传统文史与佛教、经学、天文学等研究数据的文献资源系统组成。文本工具系统下含古籍文本处理、文本挖掘与分析、视觉呈现三组模块,模块下的各子功能可根据应用需求实现流程化串联。诗歌智能分析系统以永明律与平仄律的批量自动分析、相似度与因袭关系发现及集句诗自动创作为特色功能,能够辅助古典诗歌的跨文本分析与知识图谱构建。文献研究资源提供图文对照数字化古籍资源与结构化明清小说语料,不仅广泛适用于平台各层级的功能,也是古典诗歌与小说研究的结构化专精数据库。该平台应用于教学,支持对自定义文本从自动句读、分词、实体识别等预处理阶段到风格计算、情感计量、主题模型、关系提取等任务端处理的一体化实现,并辅以案例进行成果展示,初学者可直接上手操作。未来将在开放、共建、共享的基础上,打造技术与人文实时交互的科研生态系统,创设与新时代教学相适应的应用场景,实现“人人皆可数字人文”的目标。 
  • 专辑:

    教育与社会科学综合; 哲学与人文科学; 电子技术及信息科学

  • 专题:

    中国文学; 计算机软件及计算机应用; 图书情报与数字图书馆

  • 分类号:

    TP391.1;G255.1;I207.2

下载手机APP用APP扫此码同步阅读该篇文章

温馨提示:阅读CAJ格式原文,请使用CAJ浏览器

下载:348 页码:58-93 页数:36 大小:3303K

相关推荐
  • 相似文献
  • 读者推荐
  • 相关法规
  • 关联作者