搜索引擎的研究与实现
第一章 绪论 | 第1-11页 |
·论文研究背景 | 第7-9页 |
·研究目的和研究内容 | 第9页 |
·论文章节安排 | 第9-11页 |
第二章 Google剖析 | 第11-21页 |
·Google简介 | 第11页 |
·Google系统剖析 | 第11-12页 |
·Google主要技术分析 | 第12-21页 |
·PageRank页面排序技术 | 第13-14页 |
·锚文本 | 第14-15页 |
·数据结构 | 第15-18页 |
·Web爬行技术 | 第18页 |
·Web索引技术 | 第18-19页 |
·搜索技术 | 第19-20页 |
·级别审定系统 | 第20-21页 |
第三章 搜索引擎的设计 | 第21-39页 |
·体系结构设计 | 第22-25页 |
·网页获取模块设计 | 第25-27页 |
·网页排序系统 | 第27-36页 |
·HITS算法及其变种 | 第27-30页 |
·ARC算法 | 第30页 |
·Hub平均算法 | 第30-31页 |
·阈值算法 | 第31页 |
·SALSA算法 | 第31-32页 |
·BFS算法 | 第32页 |
·PHITS | 第32-33页 |
·贝叶斯算法 | 第33-34页 |
·Reputation算法 | 第34页 |
·网站级别模型 | 第34-36页 |
·日志模块设计 | 第36-39页 |
·用户行为启示 | 第36-37页 |
·cache替换策略研究 | 第37-39页 |
第四章 搜索引擎的实现 | 第39-60页 |
·网页获取模块的实现 | 第39-41页 |
·索引模块的实现 | 第41-50页 |
·文本的词法分析 | 第42-43页 |
·中文分词技术 | 第43-44页 |
·无用词汇的删除 | 第44-45页 |
·词干提取 | 第45-49页 |
·索引词条的选择 | 第49页 |
·词典 | 第49页 |
·倒排文件 | 第49-50页 |
·搜索模块的实现 | 第50-57页 |
·布尔模型 | 第50-51页 |
·布尔查询 | 第51-54页 |
·模式匹配 | 第54-55页 |
·倒排文件的搜索 | 第55-57页 |
·cache的实现 | 第57-60页 |
结束语 | 第60-61页 |
致谢 | 第61-62页 |
参考文献 | 第62-64页 |
作者在读期间的研究工作 | 第64页 |