{$cfg_webname}
主页 > 计算机 > 论文 >

基于DBScan算法的网页聚类分析

来源:56doc.com  资料编号:5D25804 资料等级:★★★★★ %E8%B5%84%E6%96%99%E7%BC%96%E5%8F%B7%EF%BC%9A5D25804
资料以网页介绍的为准,下载后不会有水印.资料仅供学习参考之用. 帮助
资料介绍

基于DBScan算法的网页聚类分析(论文11000字)
摘要:介绍了数据挖掘、Web数据挖掘以及XML的基础知识,阐述了将XML技术应用于Web数据挖掘,构建基于XML的Web数据挖掘系统结构。之后在WEB数据挖掘的基础上,提到了DBScan算法,并使用DBScan算法引入网页聚类,提出了一种基于DBScan技术的体系结构,并尝试运用这操作对大量网页进行聚类分析,并测试本算法实际运用的准确率。
关键词:WEB数据挖掘;DBScan算法;数据挖掘;网页聚类;

Clustering analysis of web pages based on DBScan algorithm
Abstract:This paper introduces the basic knowledge of data mining, Web data mining and XML, expounds the application of XML technology to Web data mining, and constructs the Web data mining system structure based on XML. Based on the data mining in WEB, referred to the DBScan algorithm, and DBScan algorithm is used to introduce web page clustering, put forward a system structure based on DBScan technology, and try to apply this operation to a large number of web pages clustering analysis. And test the accuracy of the actual application of the algorithm.
Key words:WEB DATA MINING;DBScan algorithm;DATA MINING;Web Clustering;
 
目 录
一 绪论…………………………………………………………………5
1.1  选题背景………………………………………………………………………………5
1.2  本文的研究目标和内容………………………………………………………………5
二 相关技术和理论……………………………………………………7
2.1  web数据挖掘…………………………………………………………………………7
2.1.1  web数据挖掘内容………………………………………………………………7
2.1.2  WEB数据挖掘分类………………………………………………………………7
2.1.3  WEB数据挖掘面临的问题………………………………………………………8
2.2  XML……………………………………………………………………………………10
2.2.1 XML定义……………………………………………………………………………10
2.2.2 XML特点……………………………………………………………………………10
2.2.3 XML比起HTML的优点………………………………………………………………11
2.2.4 XML在WEB挖掘领域的应用………………………………………………………11
三 基于DBScan算法的网页聚类……………………………………13
3.1 DBScan算法概念………………………………………………………………………13
3.2 DBScan算法运算过程…………………………………………………………………14
3.3 DBScan算法优势………………………………………………………………………16
3.4 DBScan算法用于网页聚类……………………………………………………………16
四 实验和分析…………………………………………………………17
4.1 实验数据的提取………………………………………………………………………17
4.2 WEB页面转化…………………………………………………………………………18
4.3 评价指标………………………………………………………………………………19
4.1 实验结果与分析………………………………………………………………………19
五 总结…………………………………………………………………24
参考文献………………………………………………………………25
致谢……………………………………………………………………26

推荐资料