智能信息检索系统的设计与实现
| 目录 | 第1-6页 |
| 摘要 | 第6-7页 |
| ABSTRACT | 第7-8页 |
| 第1章 绪论 | 第8-14页 |
| ·研究背景 | 第8-9页 |
| ·研究现状 | 第9-13页 |
| ·论文主要工作 | 第13-14页 |
| 第2章 系统平台搭建 | 第14-25页 |
| ·平台环境搭建 | 第14-15页 |
| ·整体框架 | 第15-16页 |
| ·网页抓取模块 | 第16-19页 |
| ·原始网页的预处理 | 第19-20页 |
| ·建立索引模型 | 第20-22页 |
| ·查询服务 | 第22-25页 |
| 第3章 基于散列算法的网络爬虫实现 | 第25-38页 |
| ·问题描述 | 第25-26页 |
| ·Heritrix 机理分析 | 第26-30页 |
| ·体系架构 | 第26-27页 |
| ·Heritrix 爬虫的 URL 队列 | 第27-30页 |
| ·散列算法在爬虫中应用 | 第30-33页 |
| ·字符串散列函数 | 第30-32页 |
| ·散列函数的应用 | 第32-33页 |
| ·测试分析 | 第33-38页 |
| ·测试环境 | 第33-34页 |
| ·实验结果与分析 | 第34-38页 |
| 第4章 基于遗传算法的主题爬虫实现 | 第38-52页 |
| ·问题描述 | 第38-39页 |
| ·基于遗传算法的主题爬虫设计 | 第39-42页 |
| ·算法原理 | 第39-40页 |
| ·主题爬虫的设计 | 第40-42页 |
| ·向量空间模型 | 第42-45页 |
| ·网页主题确立 | 第42-43页 |
| ·模型元素 | 第43页 |
| ·特征权重计算 | 第43-44页 |
| ·文本相似度计算 | 第44-45页 |
| ·Heritrix 主题爬虫实现 | 第45-47页 |
| ·测试分析 | 第47-52页 |
| ·测试环境 | 第47-48页 |
| ·实验结果与分析 | 第48-52页 |
| 第5章 总结与展望 | 第52-54页 |
| 参考文献 | 第54-57页 |
| 致谢 | 第57页 |