文献知网节

基于Hadoop的电影推荐系统的研究与实现

陈旭

辽宁大学

摘要:进入Web2.0时代,互联网的应用越来越广泛,大量的电影资源在网络上涌现,为了在如此庞大而复杂的电影资源中找到感兴趣的东西,推荐系统得到了广泛的应用。大数据显示,当代更多的人更偏好在电影网站上看电影,因此电影网站在我国具有很好的发展前景,而构建一个准确高效的推荐系统是网站成功的关键。本文设计的电影推荐系统基于Hadoop平台实现,Hadoop是一个扩展性良好、高效性、开源的分布式框架,对于现代的电影推荐系统来说,每天都在飞速增长的大数据存储和计算是最大的难题,而Hadoop在解决大数据问题上有着其他平台无可比拟的优势,Map Reduce分布式框架能够实现大数据的计算,HDFS分布式文件系统能够实现大数据的存储。推荐系统的关键是推荐算法,本文提出了一种Hadoop平台下的聚类协同过滤推荐算法。首先采用Canopy算法根据用户对电影的评分记录将相似的用户粗聚类。然后对同一Canopy内的用户进行K-Means迭代计算,将Canopy聚类的个数作为K值,采用Pearson相关系数作为距离公式对用户精准聚类。Pearson相关系数反映的是两个向量之间的相关性,它考虑到了不同用户之间的评分差异... 更多
  • 专辑:

    电子技术及信息科学

  • 专题:

    计算机软件及计算机应用

  • 分类号:

    TP391.3

导师:

王青松;

学科专业:

计算机技术(专业学位)

下载手机APP用APP扫此码同步阅读该篇文章

温馨提示:阅读CAJ格式原文,请使用CAJ浏览器

下载:1426 页数:89 大小:7051K

相关推荐
  • 相似文献
  • 读者推荐
  • 相关法规
  • 关联作者
  • 攻读期成果