| 声明 | 第1页 |
| 关于论文使用授权的说明 | 第2-3页 |
| 摘要 | 第3-4页 |
| ABSTRACT | 第4-7页 |
| 1. 引言 | 第7-11页 |
| ·什么是信息检索 | 第7-8页 |
| ·机器的局限 | 第8页 |
| ·语义方法与统计方法 | 第8-10页 |
| ·本文的组织 | 第10-11页 |
| 2. 信息检索算法概述 | 第11-51页 |
| ·基本定义 | 第11-16页 |
| ·文档 | 第11-12页 |
| ·查询 | 第12页 |
| ·数据集合 | 第12页 |
| ·相关性 | 第12-14页 |
| ·排名 | 第14页 |
| ·相关性判定 | 第14-15页 |
| ·主题 | 第15页 |
| ·查询扩展 | 第15页 |
| ·相关反馈 | 第15页 |
| ·Ad Hoc | 第15-16页 |
| ·评测方法 | 第16-17页 |
| ·经典布尔模型 | 第17-18页 |
| ·扩展布尔模型 | 第18-19页 |
| ·向量空间模型 | 第19-31页 |
| ·文档的向量化表示 | 第20-21页 |
| ·索引词的区分能力 | 第21-22页 |
| ·查询的处理 | 第22-23页 |
| ·文档相关度的计算 | 第23-24页 |
| ·规格化权重 | 第24-28页 |
| ·词权重计算公式总结 | 第28-30页 |
| ·长文档问题 | 第30-31页 |
| ·概率检索模型 | 第31-39页 |
| ·KAPI 系统 | 第31-36页 |
| ·NQUERY | 第36-39页 |
| ·语言模型 | 第39-41页 |
| ·Web 信息检索—链接分析 | 第41-46页 |
| ·P ageRank 原理分析 | 第41-43页 |
| ·C LEVER 系统 | 第43-46页 |
| ·其它信息检索方法 | 第46-51页 |
| ·签名文件 | 第46-47页 |
| ·Fuzzy Set | 第47-49页 |
| ·Latent Semantic Indexing Model | 第49-51页 |
| 3. 理论与实践 TREC 中的WEB 信息检索 | 第51-68页 |
| ·引言 | 第51-52页 |
| ·TREC 2002 Web Track 测试任务 | 第52-63页 |
| ·任务简介 | 第52-53页 |
| ·基于文本内容的检索 | 第53-57页 |
| ·Named Page Finding 子任务 | 第57-62页 |
| ·Topic Distillation 子任务 | 第62-63页 |
| ·TREC 之后的实验 | 第63-66页 |
| ·OKAPI | 第63-64页 |
| ·伪相关反馈 | 第64-65页 |
| ·概率检索模型与向量空间模型的结合 | 第65-66页 |
| ·本章结束语 | 第66-68页 |
| 4. 基于遗传算法的参数优化 | 第68-88页 |
| ·信息检索现状 | 第68-69页 |
| ·遗传算法简介 | 第69-73页 |
| ·遗传算法的生物学类比 | 第69-70页 |
| ·遗传算法主要步骤 | 第70-72页 |
| ·常用算法 | 第72-73页 |
| ·信息检索中的遗传算法 | 第73-75页 |
| ·问题求解过程 | 第75-86页 |
| ·有相关性判定的求解过程 | 第77-81页 |
| ·无相关性判定的求解过程 | 第81-86页 |
| ·本章结束语 | 第86-88页 |
| 5. 信息检索方法在P2P 环境下的应用 | 第88-99页 |
| ·背景 | 第88-89页 |
| ·相关工作 | 第89-91页 |
| ·基于随机复制的方法 | 第91-97页 |
| ·模拟实验环境 | 第92-93页 |
| ·覆盖率实验 | 第93-94页 |
| ·TREC 检索任务在P2P 环境下的测试 | 第94-97页 |
| ·未来的研究 | 第97-99页 |
| 6. 总结与展望 | 第99-102页 |
| 7. 参考文献 | 第102-110页 |
| 8. 致谢 | 第110-111页 |
| 9. 作者简历 | 第111-112页 |