摘要 | 第1-4页 |
ABSTRACT | 第4-7页 |
1 绪论 | 第7-12页 |
·论文的研究背景 | 第7-8页 |
·论文的研究意义 | 第8-9页 |
·基于 XML的搜索引擎的研究现状 | 第9-10页 |
·XML搜索引擎研究目前存在的问题 | 第10-11页 |
·论文的组织及主要工作 | 第11-12页 |
2 标记语言的产生、发展及其对信息处理的影响 | 第12-20页 |
·引言 | 第12页 |
·标记语言与元语言 | 第12页 |
·SGML( Standard Generalized Markup Language)标准通用标记语言 | 第12-13页 |
·HTML( Hyper Text Markup Language)超文本标记语言 | 第13页 |
·XML(eXtensible Markup Language)可扩展标记语言 | 第13-16页 |
·HTML与 XML中的信息对比 | 第16-17页 |
·XML文档的解析 | 第17-19页 |
·小结 | 第19-20页 |
3 搜索引擎及相关技术 | 第20-34页 |
·引言 | 第20页 |
·搜索引擎概述 | 第20-24页 |
·搜索引擎的概念与分类 | 第20-22页 |
·搜索引擎的工作原理与基本结构 | 第22-23页 |
·搜索引擎发展方向 | 第23-24页 |
·网页排序技术 | 第24-27页 |
·信息检索技术 | 第27-29页 |
·布尔逻辑模型 | 第27页 |
·模糊逻辑模型 | 第27页 |
·向量空间模型 | 第27-28页 |
·概率检索模型 | 第28-29页 |
·中文分词技术 | 第29-33页 |
·汉语的特点 | 第29-30页 |
·一般的分词技术 | 第30页 |
·一种改进的MM算法 | 第30-33页 |
·小结 | 第33-34页 |
4 基于 XML的搜索引擎模型 | 第34-41页 |
·引言 | 第34页 |
·设计思想及模型 | 第34-35页 |
·各模块的具体实现思想 | 第35-40页 |
·网页采集器模块 | 第35-37页 |
·转换模块 | 第37-39页 |
·解析索引模块 | 第39-40页 |
·查询模块 | 第40页 |
·小结 | 第40-41页 |
5 XML的解析与索引 | 第41-51页 |
·引言 | 第41页 |
·XML文档的解析 | 第41-43页 |
·XML文档的索引 | 第43-50页 |
·索引的评价指标 | 第43-44页 |
·几种倒排索引方法 | 第44-46页 |
·基于 XML的搜索引擎的索引器设计思想 | 第46-48页 |
·倒排索引表的设计 | 第48-50页 |
·关键词与文档相关度的计算 | 第50页 |
·小结 | 第50-51页 |
6 结论 | 第51-53页 |
致谢 | 第53-54页 |
参考文献 | 第54-56页 |
附录 | 第56页 |