首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于K-means的网页信息检索的聚类研究及实现

目录第2-3页
摘要第3-4页
ABSTRACT第4页
第1章 引言第5-16页
    1.1. 研究背景及意义第5-6页
    1.2. 研究现状第6-14页
        1.2.1. 数据挖掘概述第7-9页
        1.2.2. 数据挖掘的起源和挑战第9-11页
        1.2.3. Web数据挖掘研究现状和趋势第11-14页
        1.2.4. Web数据挖掘流程第14页
    1.3. 论文研究内容第14-15页
    1.4. 论文结构安排第15-16页
第2章 网页信息检索的聚类模型分析第16-23页
    2.1. 基本概念第16-18页
        2.1.1. 聚类数据的预处理第16-17页
        2.1.2. 聚类分析的有关统计量第17-18页
    2.2. K-means及其它聚类算法第18-19页
        2.2.1. K-means算法第18-19页
        2.2.2. 其它的聚类算法第19页
    2.3. 网页信息检索模型第19-20页
    2.4. 网页的提取及预处理第20-23页
        2.4.1. 网页获取与解析第21页
        2.4.2. 停用词移除与词干提取第21-22页
        2.4.3. 特征向量转化第22-23页
第3章 系统架构设计第23-34页
    3.1. 系统设计背景第23页
    3.2. 系统总体框架设计第23-26页
    3.3. 系统技术体系结构设计第26-30页
        3.3.1. 分布式体系结构设计第26-27页
        3.3.2. 分层次体系结构设计第27-30页
    3.4. 系统数据流控制设计第30-34页
第4章 网页信息检索系统的聚类实现第34-49页
    4.1. Web数据挖掘框架设计第34-36页
    4.2. 系统子模块实现第36-49页
        4.2.1. 网页检索模块第36-38页
        4.2.2. 预处理模块第38-43页
        4.2.3. 聚类处理模块第43-45页
        4.2.4. 用户界面及结果呈现第45-49页
第5章 总结与展望第49-50页
参考文献第50-52页
致谢第52-53页

论文共53页,点击 下载论文
上一篇:寿险销售渠道管理系统的设计与实现
下一篇:超图及稀疏表示在隐写术中的研究