文献知网节

基于XML的半结构化数据存储技术研究

王燕丽

山东科技大学

摘要:互联网的迅速发展,使得网上数据不断激增。这些数据缺乏统一的、固定的模式,而且往往是不规则、经常变化的。因此,半结构化数据模型应运而生,它是介于完全结构化数据和无结构化数据之间的一种数据类型。要想对这种半结构化数据进行有效的管理是十分困难的。如何对半结构化数据进行有效的管理成为研究的热点。 XML技术的出现,推动了半结构化数据的发展。XML数据是一种自描述的半结构化数据,利用XML文档来管理半结构化数据是一种有效的途径。由于关系数据库在各方面都相对成熟和稳定,因而采用关系数据库对XML数据进行存储和操作,将半结构化转化为结构化的数据,具有重大的理论意义和实用价值。 论文的研究从分析半结构化数据和XML相关技术出发,旨在设计一种实现半结构化数据到XML数据的映射算法和一种半结构化数据的存储结构实现XML数据到关系数据库的映射。 论文深入探讨了半结构化数据的定义及特点,分析半结构化数据的模式描述形式以及半结构化数据的模式抽取技术,详细介绍了XML和数据库的转换技术。 目前最具有代表性的半结构化数据的模式描述形式是OEM模型,它是一种带有嵌套和标记的自描述性有向图。论文... 更多
  • 专辑:

    电子技术及信息科学

  • 专题:

    计算机软件及计算机应用

  • 分类号:

    TP311.13

导师:

孙忠林;

学科专业:

计算机应用技术

下载手机APP用APP扫此码同步阅读该篇文章

温馨提示:阅读CAJ格式原文,请使用CAJ浏览器

下载:212 页数:57 大小:2905K

相关推荐
  • 相似文献
  • 读者推荐
  • 相关法规
  • 关联作者
  • 攻读期成果