主题搜索与Web挖掘的研究及系统实现

摘要	第1-4页
Abstract	第4-8页
第一章绪论	第8-12页
·课题背景	第8-9页
·研究现状	第9页
·本文的研究内容	第9-11页
·论文的组织结构	第11-12页
第二章 Web挖掘技术	第12-18页
·Web挖掘概述	第12页
·Web挖掘的特点	第12-13页
·Web挖掘的分类	第13-14页
·Web挖掘应用	第14-16页
·Web内容挖掘的应用	第15页
·Web结构挖掘的应用	第15-16页
·Web使用挖掘的应用	第16页
·小结	第16-18页
第三章主题搜索引擎技术	第18-26页
·主题搜索引擎技术综述	第18-20页
·产生背景	第18-19页
·主要技术和难点	第19页
·典型主题搜索引擎系统	第19-20页
·主题网络爬虫	第20-22页
·工作原理	第20-21页
·主要功能	第21页
·关键技术	第21-22页
·网络协议	第22-24页
·协议特点	第22-23页
·主要消息格式	第23-24页
·小结	第24-26页
第四章系统主要理论和算法	第26-46页
·主题网络爬虫搜索算法	第26-31页
·非贪婪链接选择策略	第26-27页
·网络搜索算法设计	第27-28页
·非贪婪遗传搜索算法	第28-29页
·性能分析	第29-31页
·HTML文档解析	第31-34页
·HTML的格式及特点	第31-32页
·HTML的树型结构	第32-33页
·HTML树结构解析	第33-34页
·Web文本分析	第34-37页
·中文编码转换	第34页
·中文分词技术	第34-35页
·权重计算	第35-37页
·主题相关度计算	第37-41页
·网页与主题的相关性判定	第37-39页
·URL与主题的相关性判定	第39-41页
·层次K-Means Web文档聚类算法	第41-45页
·算法分析	第41-42页
·算法参数说明	第42-43页
·算法步骤	第43-44页
·性能分析	第44-45页
·小结	第45-46页
第五章系统的设计与实现	第46-74页
·系统介绍	第46-47页
·线程管理模块	第47-50页
·线程工作流程	第47-48页
·线程同步	第48-49页
·编码实现	第49-50页
·种子URL选择模块	第50-53页
·URL调度模块	第53-57页
·URL的分类	第53-54页
·URL的管理	第54-55页
·编码实现	第55-57页
·网页下载模块	第57-58页
·网页解析模块	第58-61页
·内容提取	第58-60页
·文本分析	第60-61页
·数据存储模块	第61-66页
·数据类型	第62页
·数据存储设计	第62-65页
·编码实现	第65-66页
·检索模块	第66-68页
·系统运行实现	第68-73页
·小结	第73-74页
第六章总结与展望	第74-76页
·研究工作的总结	第74页
·趋势与展望	第74-76页
致谢	第76-78页
参考文献	第78-82页
在读期间发表的学术论文	第82页