首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于聚类的网页相关性挖掘技术研究

摘要第3-4页
Abstract第4页
目录第5-7页
第一章 引言第7-9页
    1.1 研究的背景和意义第7-8页
    1.2 论文的组织第8-9页
第二章 数据挖掘技术和网页挖掘技术概述第9-15页
    2.1 数据挖掘技术第9-12页
        2.1.1 数据挖掘技术的产生第9页
        2.1.2 数据挖掘的定义第9-10页
        2.1.3 数据挖掘的研究内容第10页
        2.1.4 数据挖掘的功能分类第10-11页
        2.1.5 数据挖掘的发展方向第11-12页
    2.2 网页挖掘技术第12-14页
        2.2.1 网页挖掘的定义第12页
        2.2.2 网页挖掘的分类第12-13页
        2.2.3 网页挖掘的挑战第13-14页
    2.3 网页挖掘与数据挖掘的区别第14-15页
第三章 聚类分析算法第15-26页
    3.1 聚类分析概述第15-18页
    3.2 聚类分析中的数据表示第18-19页
        3.2.1 数据矩阵第18-19页
        3.2.2 差异矩阵第19页
    3.3 聚类分析中距离度量第19-21页
        3.3.1 数值型变量的距离度量第19-20页
        3.3.2 二值变量的距离度量第20-21页
    3.4 聚类分析算法分类第21-22页
    3.5 常用的聚类分析方法第22-26页
        3.5.1 k-means 算法第22-23页
        3.5.2 k-medoids 算法第23-24页
        3.5.3 层次聚类算法第24-25页
        3.5.4 动态聚类算法第25-26页
第四章 网页文本内容的特征抽取第26-37页
    4.1 检索模型的比较和选择第26-28页
    4.2 权重的计算第28-30页
    4.3 特征的选择第30-32页
    4.4 重复短语的识别第32-37页
第五章 网页相关性挖掘原型系统实现第37-42页
    5.1 系统设计第37-40页
        5.1.1 系统的架构和功能设计第37-38页
        5.1.2 系统的接口设计第38-40页
    5.2 系统运行结果第40-41页
    5.3 系统评价第41-42页
第六章 结论第42-43页
参考文献第43-45页
后记第45-46页
在学期间公开发表论文及著作情况第46页

论文共46页,点击 下载论文
上一篇:分布式麦克风阵列声源跟踪方法的研究
下一篇:中国共产党群众路线思想发展轨迹研究