基于Web挖掘的搜索引擎技术研究

摘要	第1-5页
Abstract	第5-8页
引言	第8-10页
第1章绪论	第10-17页
1．1 论文选题的意义	第10-12页
1．1．1 选题研究背景	第10页
1．1．2 搜索引擎面临的问题	第10-12页
1．2 国内外的研究动向	第12-15页
1．3 论文的研究内容和结构安排	第15-17页
第2章搜索引擎相关理论	第17-28页
2．1 搜索引擎工作原理	第17页
2．2 搜索引擎的分类及评价标准	第17-22页
2．2．1 搜索引擎的分类	第17-21页
2．2．2 搜索引擎的评价标准	第21页
2．2．3 关于智能	第21-22页
2．3 当前搜索引擎的关键技术	第22-28页
2．3．1 信息获取策略	第22-23页
2．3．2 检索结果的联机聚类	第23-24页
2．3．3 基于超链的相关度排序	第24-25页
2．3．4 基于概念的检索	第25-26页
2．3．5 基于相关度反馈	第26-28页
第3章 Web挖掘理论基础	第28-43页
3．1 Web掘的定义	第28-29页
3．2 Web挖掘的分类	第29-33页
3．2．1 Web内容挖掘	第29-31页
3．2．2 Web结构挖掘	第31-32页
3．2．3 Web使用记录挖掘	第32-33页
3．3 Web挖掘的特点	第33-34页
3．4 Web挖掘应用于搜索引擎	第34-42页
3．4．1 Web信息检索定义	第34页
3．4．2 搜索引擎技术研究现状与存在问题	第34-36页
3．4．3 Web挖掘与搜索引擎的关系	第36-38页
3．4．4 Web挖掘应用于搜索引擎技术	第38-42页
3．5 本章小结	第42-43页
第4章系统的剖析	第43-48页
4．1 系统特性	第43-44页
4．2 系统的硬件拓扑	第44-45页
4．3 系统的软件模块	第45-46页
4．4 系统的工作原理	第46-47页
4．5 系统的开发环境及配置	第47页
4．6 本章小结	第47-48页
第5章系统的设计与实现	第48-65页
5．1 网络机器人的设计	第48-51页
5．1．1 搜索模型和算法设计	第48-50页
5．1．2 并行的搜集方案	第50-51页
5．1．3 镜像网页的消除	第51页
5．2 网页的分析	第51-53页
5．2．1 中文的编码处理	第52页
5．2．2 特征值提取	第52-53页
5．2．3 生成网页的描述信息	第53页
5．3 索引的生成	第53-57页
5．3．1 索引的结构	第54页
5．3．2 网页索引的生成	第54-56页
5．3．3 超链分析	第56-57页
5．4 检索	第57-62页
5．4．1 找到相关的网页	第57-59页
5．4．2 对结果进行排序	第59-61页
5．4．3 建立 Cache	第61-62页
5．5 用户界面	第62-63页
5．5．1 用户的界面技术	第62页
5．5．2 提供个性化服务	第62-63页
5．6 系统测试和性能分析	第63-65页
第6章总结与展望	第65-67页
6．1 全文总结	第65页
6．2 本论文的主要成果	第65-66页
6．3 研究展望	第66-67页
附录	第67-70页
参考文献	第70-73页
致谢	第73页