基于Hadoop的数据可视化技术研究与应用
胡琴琴
北方工业大学
摘要:本课题主要研究多数据库环境下商业数据可视化的问题,所有的业务数据存储在不同的数据库服务器上。由于多数据库环境在对平台整体数据进行可视化时,需要对各业务数据库服务器分别进行统计分析,再对统计结果进行合并,使得数据分析阶段效率较低。因此本文在研究过程中首先将分散的数据集成到数据仓库中,然后再针对数据仓库中的数据进行可视化数据展现。首先,通过对分散数据的集成方法的研究,确定了利用Hadoop技术进行分散数据集成。Hadoop生态系统提供的Hive工具可以用于多维数据分析,Sqoop工具可以实现关系型数据库与Hadoop之间的数据传输。研究中利用Hive技术搭建数据仓库,通过Sqoop技术将数据从分散的数据库服务器加载到Hive数据仓库中,完成可视化数据准备工作。其次,研究行业数据可视化的技术和方法,具体分析了商业数据的特点及数据展现形式。设计实现了基于SVG (Scalable Vector Graphics)的地图可视化算法,可以将可视化数据进行维度与数量的自定义配置,使得可视化的结果更加丰富且直观。然后,针对实际应用,从销售分析、商品分析、客户购物偏好、企业排名等分析视角出发,利用HQL... 更多
- 专辑:
电子技术及信息科学
- 专题:
计算机软件及计算机应用
- 分类号:
TP311.13
导师:
李也白;
学科专业:
计算机科学与技术
- 手机阅读
即刻使用手机阅读
第一步扫描二维码下载
"移动知网-全球学术快报"客户端
第二步打开“全球学术快报”
点击首页左上角的扫描图标
第三步扫描二维码
手机同步阅读本篇文献
- CAJ整本下载
- CAJ分章下载
- 在线阅读
- PDF整本下载
下载手机APP用APP扫此码同步阅读该篇文章
温馨提示:阅读CAJ格式原文,请使用CAJ浏览器。
下载:1795 页数:62 大小:6064K
核心文献推荐
相关推荐
- 相似文献
- 读者推荐
- 关联作者
- 攻读期成果
- [1]基于Hadoop的分布式文本聚类研究[D]. 梁维铿.华南理工大学 2011
- [2]基于Hadoop的倒排索引技术的研究[D]. 董长春.辽宁大学 2011
- [3]Hadoop分布式数据清洗方案[D]. 郭逸重.华南理工大学 2012
- [4]基于Hadoop平台的字符识别的研究[D]. 杨超.西安电子科技大学 2012
- [5]倒排索引技术在Hadoop平台上的研究与实现[D]. 代万能.电子科技大学 2013
- [6]基于Hadoop的数字图书馆构建研究[D]. 刘学胜.西安电子科技大学 2012
- [7]基于Hadoop平台的语义网研究[D]. 李宛桐.吉林大学 2013
- [8]基于Hadoop的频繁闭项集挖掘算法研究[D]. 陈光鹏.南京大学 2012
- [9]面向Hadoop作业的工作流引擎的设计和实现[D]. 张迪.北京邮电大学 2014
- [10]基于Hadoop的数字家庭云系统的设计与实现[D]. 邹建.大连理工大学 2014