基于Web挖掘的搜索引擎技术研究
摘要 | 第1-5页 |
Abstract | 第5-8页 |
引言 | 第8-10页 |
第1章 绪论 | 第10-17页 |
1.1 论文选题的意义 | 第10-12页 |
1.1.1 选题研究背景 | 第10页 |
1.1.2 搜索引擎面临的问题 | 第10-12页 |
1.2 国内外的研究动向 | 第12-15页 |
1.3 论文的研究内容和结构安排 | 第15-17页 |
第2章 搜索引擎相关理论 | 第17-28页 |
2.1 搜索引擎工作原理 | 第17页 |
2.2 搜索引擎的分类及评价标准 | 第17-22页 |
2.2.1 搜索引擎的分类 | 第17-21页 |
2.2.2 搜索引擎的评价标准 | 第21页 |
2.2.3 关于智能 | 第21-22页 |
2.3 当前搜索引擎的关键技术 | 第22-28页 |
2.3.1 信息获取策略 | 第22-23页 |
2.3.2 检索结果的联机聚类 | 第23-24页 |
2.3.3 基于超链的相关度排序 | 第24-25页 |
2.3.4 基于概念的检索 | 第25-26页 |
2.3.5 基于相关度反馈 | 第26-28页 |
第3章 Web挖掘理论基础 | 第28-43页 |
3.1 Web掘的定义 | 第28-29页 |
3.2 Web挖掘的分类 | 第29-33页 |
3.2.1 Web内容挖掘 | 第29-31页 |
3.2.2 Web结构挖掘 | 第31-32页 |
3.2.3 Web使用记录挖掘 | 第32-33页 |
3.3 Web挖掘的特点 | 第33-34页 |
3.4 Web挖掘应用于搜索引擎 | 第34-42页 |
3.4.1 Web信息检索定义 | 第34页 |
3.4.2 搜索引擎技术研究现状与存在问题 | 第34-36页 |
3.4.3 Web挖掘与搜索引擎的关系 | 第36-38页 |
3.4.4 Web挖掘应用于搜索引擎技术 | 第38-42页 |
3.5 本章小结 | 第42-43页 |
第4章 系统的剖析 | 第43-48页 |
4.1 系统特性 | 第43-44页 |
4.2 系统的硬件拓扑 | 第44-45页 |
4.3 系统的软件模块 | 第45-46页 |
4.4 系统的工作原理 | 第46-47页 |
4.5 系统的开发环境及配置 | 第47页 |
4.6 本章小结 | 第47-48页 |
第5章 系统的设计与实现 | 第48-65页 |
5.1 网络机器人的设计 | 第48-51页 |
5.1.1 搜索模型和算法设计 | 第48-50页 |
5.1.2 并行的搜集方案 | 第50-51页 |
5.1.3 镜像网页的消除 | 第51页 |
5.2 网页的分析 | 第51-53页 |
5.2.1 中文的编码处理 | 第52页 |
5.2.2 特征值提取 | 第52-53页 |
5.2.3 生成网页的描述信息 | 第53页 |
5.3 索引的生成 | 第53-57页 |
5.3.1 索引的结构 | 第54页 |
5.3.2 网页索引的生成 | 第54-56页 |
5.3.3 超链分析 | 第56-57页 |
5.4 检索 | 第57-62页 |
5.4.1 找到相关的网页 | 第57-59页 |
5.4.2 对结果进行排序 | 第59-61页 |
5.4.3 建立 Cache | 第61-62页 |
5.5 用户界面 | 第62-63页 |
5.5.1 用户的界面技术 | 第62页 |
5.5.2 提供个性化服务 | 第62-63页 |
5.6 系统测试和性能分析 | 第63-65页 |
第6章 总结与展望 | 第65-67页 |
6.1 全文总结 | 第65页 |
6.2 本论文的主要成果 | 第65-66页 |
6.3 研究展望 | 第66-67页 |
附录 | 第67-70页 |
参考文献 | 第70-73页 |
致谢 | 第73页 |