专业搜索引擎的研究与设计

目录	第1-4页
摘要	第4-5页
ABSTRACT	第5-6页
引言	第6-7页
第一章专业搜索引擎研究的背景及意义	第7-12页
1．1 搜索引擎的发展史	第7页
1．2 搜索引擎的发展趋势	第7-8页
1．3 专业搜索引擎概况	第8-10页
1．3．1 专业搜索引擎产生的背景	第9页
1．3．2 专业搜索引擎目前的研究状况	第9-10页
1．4 本论文的主要内容	第10-12页
第二章背景知识及相关方法	第12-23页
2．1 数据挖掘	第12-20页
2．1．1 关联规则挖掘	第12-14页
2．1．2 分类	第14-17页
2．1．3 聚类	第17-20页
2．2 本体论简介	第20-21页
2．3 主题页面在Web上的分布特征	第21-23页
第三章专业搜索引擎	第23-35页
3．1 通用搜索引擎	第23-27页
3．1．1 通用搜索引擎的分类	第23-25页
3．1．2 通用搜索引擎的工作原理	第25-27页
3．2 专业搜索引擎简介	第27-28页
3．3 专业搜索引擎系统总体结构	第28-29页
3．4 本体论的设计	第29-31页
3．5 语言处理器模块	第31-32页
3．6 数据挖掘器	第32-33页
3．6．1 关键字关联	第32页
3．6．2 文档聚类	第32-33页
3．7 数据库模块	第33-35页
第四章页面解析和中文分词	第35-42页
4．1 页面解析的任务、过程	第35页
4．2 中文分词简介	第35-36页
4．3 交集型切分歧义的分类	第36-39页
4．3．1 交集字段和最大交集字段	第36-37页
4．3．2 最大交集字段按宏结构分类	第37-39页
4．4 歧义处理方法	第39-42页
4．4．1 最大交集字段的提取	第39页
4．4．2 切分原则	第39-40页
4．4．3 几种主要类型的切分规则	第40-42页
第五章专业搜索引擎网络蜘蛛的设计	第42-53页
5．1 专业搜索引擎网络蜘蛛系统模型	第42页
5．2 网络蜘蛛搜索策略	第42-50页
5．2．1 网络蜘蛛搜索策略概述	第42-46页
5．2．2 非贪婪搜索策略	第46-47页
5．2．3 IPageRank算法	第47-50页
5．3 页面与主题的相关性判定	第50-53页
5．3．1 标准搜索主题特征向量的提取	第50-51页
5．3．2 改进的VSM方法	第51页
5．3．3 特征项加权模型	第51-52页
5．3．4 页面与主题的相关性判定	第52-53页
第六章排序算法	第53-60页
6．1 搜索过程	第53页
6．2 我们的排序算法	第53-60页
6．2．1 链接扩展	第53-56页
6．2．2排序算法	第56-58页
6．2．3 排序结果分析	第58-60页
第七章回顾与展望	第60-61页
参考文献：	第61-64页
致谢	第64页