基于MapReduce的并行K-means聚类
资料介绍:
基于MapReduce的并行K-means聚类(中文3400字,英文PDF)
摘要 数据聚类在许多应用中受到了相当多的关注,例如数据挖掘,文档检索,图像分割和模式分类。随着技术进步而不断增加的信息量使得大规模数据聚类成为一项具有挑战性的任务。为了解决这个问题,许多研究人员试图设计出高效的并行聚类算法。在本文中,我们提出了一种基于MapReduce的并行K-means聚类算法,这是一种简单但功能强大的并行编程技术。实验结果表明,该算法能够很好地拓展,并且能够有效地处理商用硬件上的大型数据集。
关键词:数据挖掘;并行聚类;K-means;Hadoop;MapReduce
[资料来源:Doc163.com]
[资料来源:http://Doc163.com]