NERMS中基于Internet的搜索引擎研究与实现

第一章概述	第6-12页
1.1 搜索引擎的意义	第6页
1.2 搜索引擎的概念、产生和发展	第6-10页
1.2.1 搜索引擎的基本概念	第6-7页
1.2.2 搜索引擎的分类	第7-8页
1.2.3 搜索引擎的发展	第8-10页
1.2.4 搜索引擎的评价标准	第10页
1.3 本文所做的工作	第10-12页
第二章页面收集和站点爬行	第12-23页
2.1 Spider程序	第12页
2.2 使用HTTP访问站点	第12-17页
2.2.1 分析HTTP协议	第12页
2.2.2 地址格式	第12-15页
2.2.3 使用套接字进行HTTP编程	第15-17页
2.3 使用HTTPS访问加密站点	第17-20页
2.3.1 HTTP与HTTPS	第17-18页
2.3.2 HTTP用户认证	第18-20页
2.4 发送表单	第20-21页
2.4.1 仿真表单	第20页
2.4.2 不安全字符与URL编码	第20-21页
2.5 探索Cookie	第21-22页
2.5.1 Cookie的Internet标准	第21-22页
2.5.2 处理会话Cookie和永久Cookie	第22页
2.6 小结	第22-23页
第三章页面解析和索引词汇的提取	第23-35页
3.1 页面解析	第23-24页
3.1.1 解析HTML	第23-24页
3.2 文本预处理	第24-26页
3.2.1 文本预处理的过程	第24页
3.2.2 文本的词法分析	第24-25页
3.2.3 中文分词技术	第25页
3.2.4 无用词汇的删除	第25页
3.2.5 词干提取技术	第25-26页
3.2.6 索引词条的选择	第26页
3.2.7 词典	第26页
3.3 基于规则的中文分词	第26-33页
3.3.1 交集型切分歧义的分类	第27-30页
3.3.2 歧义处理方法	第30-33页
3.4 建立模型和索引	第33-34页
3.4.1 信息获取模型	第33-34页
3.4.2 倒排文件索引	第34页
3.5 小结	第34-35页
第四章搜索过程和搜索结果排序	第35-39页
4.1 搜索过程	第35页
4.2 搜索结果排序方法	第35-36页
4.3 PageRank算法介绍	第36-37页
4.4 HITS算法介绍	第37-38页
4.5 小结	第38-39页
第五章搜索引擎的设计与实现	第39-46页
5.1 搜索引擎系统结构	第39-40页
5.2 爬行器的设计与实现	第40-41页
5.3 解析器和索引器的设计与实现	第41-42页
5.4 搜索和结果排序的设计与实现	第42-43页
5.5 数据访问对象	第43-44页
5.6 系统实现平台	第44-46页
5.6.1 系统实现平台	第44页
5.6.2 运行结果	第44-46页
第六章结束语	第46-48页
6.1 结论	第46页
6.2 今后工作的展望	第46-48页
参考文献	第48-49页
致谢	第49-50页
中文摘要	第50-53页
Abstract	第53页