首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

主题搜索与Web挖掘的研究及系统实现

摘要第1-4页
Abstract第4-8页
第一章 绪论第8-12页
   ·课题背景第8-9页
   ·研究现状第9页
   ·本文的研究内容第9-11页
   ·论文的组织结构第11-12页
第二章 Web挖掘技术第12-18页
   ·Web挖掘概述第12页
   ·Web挖掘的特点第12-13页
   ·Web挖掘的分类第13-14页
   ·Web挖掘应用第14-16页
     ·Web内容挖掘的应用第15页
     ·Web结构挖掘的应用第15-16页
     ·Web使用挖掘的应用第16页
   ·小结第16-18页
第三章 主题搜索引擎技术第18-26页
   ·主题搜索引擎技术综述第18-20页
     ·产生背景第18-19页
     ·主要技术和难点第19页
     ·典型主题搜索引擎系统第19-20页
   ·主题网络爬虫第20-22页
     ·工作原理第20-21页
     ·主要功能第21页
     ·关键技术第21-22页
   ·网络协议第22-24页
     ·协议特点第22-23页
     ·主要消息格式第23-24页
   ·小结第24-26页
第四章 系统主要理论和算法第26-46页
   ·主题网络爬虫搜索算法第26-31页
     ·非贪婪链接选择策略第26-27页
     ·网络搜索算法设计第27-28页
     ·非贪婪遗传搜索算法第28-29页
     ·性能分析第29-31页
   ·HTML文档解析第31-34页
     ·HTML的格式及特点第31-32页
     ·HTML的树型结构第32-33页
     ·HTML树结构解析第33-34页
   ·Web文本分析第34-37页
     ·中文编码转换第34页
     ·中文分词技术第34-35页
     ·权重计算第35-37页
   ·主题相关度计算第37-41页
     ·网页与主题的相关性判定第37-39页
     ·URL与主题的相关性判定第39-41页
   ·层次K-Means Web文档聚类算法第41-45页
     ·算法分析第41-42页
     ·算法参数说明第42-43页
     ·算法步骤第43-44页
     ·性能分析第44-45页
   ·小结第45-46页
第五章 系统的设计与实现第46-74页
   ·系统介绍第46-47页
   ·线程管理模块第47-50页
     ·线程工作流程第47-48页
     ·线程同步第48-49页
     ·编码实现第49-50页
   ·种子URL选择模块第50-53页
   ·URL调度模块第53-57页
     ·URL的分类第53-54页
     ·URL的管理第54-55页
     ·编码实现第55-57页
   ·网页下载模块第57-58页
   ·网页解析模块第58-61页
     ·内容提取第58-60页
     ·文本分析第60-61页
   ·数据存储模块第61-66页
     ·数据类型第62页
     ·数据存储设计第62-65页
     ·编码实现第65-66页
   ·检索模块第66-68页
   ·系统运行实现第68-73页
   ·小结第73-74页
第六章 总结与展望第74-76页
   ·研究工作的总结第74页
   ·趋势与展望第74-76页
致谢第76-78页
参考文献第78-82页
在读期间发表的学术论文第82页

论文共82页,点击 下载论文
上一篇:运动人体检测与异常行为识别技术研究与实现
下一篇:面向社区服务的联机分析系统研究与实现