基于二进制人工蜂群的聚类算法研究(论文18000字)
盛昕鑫
南京信息工程大学计算机与软件学院,江苏南京 210044
摘要:聚类算法作为在数据挖掘领域中最重要的算法之一,从一提出开始就广泛被应用到信息检索,社交网络分析,隐私保护,图像文本分析以及生物信息学等领域。但随着科技社会的不断进步,那些含有分类属性性质的的数据变得越来越广泛。然而那些传统的经典聚类算法已经不能让我们满足这些需求,就在这个时候能够优秀快速处理具有分类属性数据的K-Modes聚类算法算法开始被人们所接受。
本文中针对基于蜂群算法的聚类算法的基本研究如下:
1. 介绍一下几种经典的聚类算法,包括K-Means聚类算法,层次聚类算法,以及K-Modes算法,简述它们的执行步骤以及优缺点
2. 介绍下经典人工蜂群算法,阐述了算法的简单步骤以及该算法在被运用时的优缺点。
3. 针对所提出的人工蜂群聚类算法,介绍基本运算步骤,时空复杂度,以及针对不同的分类属性数据集与一些法的在时间以及效率上的对比。
4. 将蜂群聚类算法运用到经典的的商品推荐分析上,借此来证实算法的实用性可用性
关键词:算法优化K-Mode,人工蜂群算法,商品推荐
Research for Artificial Bee Colony Algorithm with The K-Modes Clustering Algorithm
Sheng Xinxin
School Of Computer and Software Engineering, NUIST, Nanjing 210044, China
Abstract: Clustering algorithms is one approach for data mining, After it was proposed, clustering algorithms has been used in many fields, such as information retrieval, social media analysis, privacy preserving, image analysis,text analysis and bioinformatics.But with the development of the technology, the data with categorical attributes become more and more popular,Traditional clustering algorithms can not meet our demand, so K-Modes algorithm which can handle categorical attributes began to be gradually accepted.
In this paper, for the combination of the clustering algorithm and artificial bee colony algorithm is studied as follows:
1. Having a brief introduction for clustering algorithm such as K-Means,hierarchical methods cluster algorithm,also K-Modes clustering algorithm.In the section,we will introduce the simple steps and advantages and disadvantages of them.
2. A brief introduction for artificial bee colony algorithm, and simple steps for the algorithm.After that,having a learning on the advantages and disadvantages of the it.
3.For artificial bee colony clustering algorithm, the paper introduces the basic operation steps of the algorithm and the complexity of time and space, as well as comparative data for different categorical attributes set with some classical algorithm. Thereby to demonstrate the significance of the algorithm propose.
4.use the colony algorithm to a product recommendation up to confirm the availability of the algorithm
Keywords: K-Modes algorithm,Artificial colony algorithm,algorithm optimization,product recommendation
目录
第1章绪论 1
1.1 研究背景以及研究意义 1
1.2国内外研究现状 2
1.2.1国内外数据挖掘研究现状 2
1.2.2国内外聚类分析研究现状 3
1.2.3 群体智能二进制人工蜂群算法研究现状 4
1.3论文研究内容 4
1.4论文主要结构 4
第2章 聚类算法分析 6
2.1聚类算法简介以及描述 6
2.1.1 几种聚类算法 7
2.2 K-Modes算法 8
2.3本章小结 10
第3章 二进制人工蜂群算法分析 11
3.1二进制人工蜂群算法简介以及描述 11
3.2二进制人工蜂群算法分析 12
3.3本章小结 13
第4章 二进制人工蜂群聚类算法的改进 14
4.1二进制人工蜂群聚类算法简介 14
4.2二进制人工蜂群聚类算法分析 17
4.3二进制人工蜂群聚类算法评价 17
4.4本章小结 20
第5章 二进制蜂群聚类算法在商品推荐系统中的应用 21
5.1 商品推荐系统以及协同过滤简介 21
5.2 二进制蜂群聚类算法在商品推荐系统中的应用分析 21
5.3 二进制蜂群聚类算法在商品推荐系统中应用的结果展示及分析 23
5.3.1 用户的聚类 23
5.3.2查找类似用户进行推荐 25
5.4 本章小结 25
第6章结论与展望 26
6.1结论 26
6.2展望 26
参考文献 27
致谢 29 |