智能信息检索系统的设计与实现
目录 | 第1-6页 |
摘要 | 第6-7页 |
ABSTRACT | 第7-8页 |
第1章 绪论 | 第8-14页 |
·研究背景 | 第8-9页 |
·研究现状 | 第9-13页 |
·论文主要工作 | 第13-14页 |
第2章 系统平台搭建 | 第14-25页 |
·平台环境搭建 | 第14-15页 |
·整体框架 | 第15-16页 |
·网页抓取模块 | 第16-19页 |
·原始网页的预处理 | 第19-20页 |
·建立索引模型 | 第20-22页 |
·查询服务 | 第22-25页 |
第3章 基于散列算法的网络爬虫实现 | 第25-38页 |
·问题描述 | 第25-26页 |
·Heritrix 机理分析 | 第26-30页 |
·体系架构 | 第26-27页 |
·Heritrix 爬虫的 URL 队列 | 第27-30页 |
·散列算法在爬虫中应用 | 第30-33页 |
·字符串散列函数 | 第30-32页 |
·散列函数的应用 | 第32-33页 |
·测试分析 | 第33-38页 |
·测试环境 | 第33-34页 |
·实验结果与分析 | 第34-38页 |
第4章 基于遗传算法的主题爬虫实现 | 第38-52页 |
·问题描述 | 第38-39页 |
·基于遗传算法的主题爬虫设计 | 第39-42页 |
·算法原理 | 第39-40页 |
·主题爬虫的设计 | 第40-42页 |
·向量空间模型 | 第42-45页 |
·网页主题确立 | 第42-43页 |
·模型元素 | 第43页 |
·特征权重计算 | 第43-44页 |
·文本相似度计算 | 第44-45页 |
·Heritrix 主题爬虫实现 | 第45-47页 |
·测试分析 | 第47-52页 |
·测试环境 | 第47-48页 |
·实验结果与分析 | 第48-52页 |
第5章 总结与展望 | 第52-54页 |
参考文献 | 第54-57页 |
致谢 | 第57页 |