搜索引擎的研究与实现
| 第一章 绪论 | 第1-11页 |
| ·论文研究背景 | 第7-9页 |
| ·研究目的和研究内容 | 第9页 |
| ·论文章节安排 | 第9-11页 |
| 第二章 Google剖析 | 第11-21页 |
| ·Google简介 | 第11页 |
| ·Google系统剖析 | 第11-12页 |
| ·Google主要技术分析 | 第12-21页 |
| ·PageRank页面排序技术 | 第13-14页 |
| ·锚文本 | 第14-15页 |
| ·数据结构 | 第15-18页 |
| ·Web爬行技术 | 第18页 |
| ·Web索引技术 | 第18-19页 |
| ·搜索技术 | 第19-20页 |
| ·级别审定系统 | 第20-21页 |
| 第三章 搜索引擎的设计 | 第21-39页 |
| ·体系结构设计 | 第22-25页 |
| ·网页获取模块设计 | 第25-27页 |
| ·网页排序系统 | 第27-36页 |
| ·HITS算法及其变种 | 第27-30页 |
| ·ARC算法 | 第30页 |
| ·Hub平均算法 | 第30-31页 |
| ·阈值算法 | 第31页 |
| ·SALSA算法 | 第31-32页 |
| ·BFS算法 | 第32页 |
| ·PHITS | 第32-33页 |
| ·贝叶斯算法 | 第33-34页 |
| ·Reputation算法 | 第34页 |
| ·网站级别模型 | 第34-36页 |
| ·日志模块设计 | 第36-39页 |
| ·用户行为启示 | 第36-37页 |
| ·cache替换策略研究 | 第37-39页 |
| 第四章 搜索引擎的实现 | 第39-60页 |
| ·网页获取模块的实现 | 第39-41页 |
| ·索引模块的实现 | 第41-50页 |
| ·文本的词法分析 | 第42-43页 |
| ·中文分词技术 | 第43-44页 |
| ·无用词汇的删除 | 第44-45页 |
| ·词干提取 | 第45-49页 |
| ·索引词条的选择 | 第49页 |
| ·词典 | 第49页 |
| ·倒排文件 | 第49-50页 |
| ·搜索模块的实现 | 第50-57页 |
| ·布尔模型 | 第50-51页 |
| ·布尔查询 | 第51-54页 |
| ·模式匹配 | 第54-55页 |
| ·倒排文件的搜索 | 第55-57页 |
| ·cache的实现 | 第57-60页 |
| 结束语 | 第60-61页 |
| 致谢 | 第61-62页 |
| 参考文献 | 第62-64页 |
| 作者在读期间的研究工作 | 第64页 |