声明 | 第1页 |
关于论文使用授权的说明 | 第2-3页 |
摘要 | 第3-4页 |
ABSTRACT | 第4-7页 |
1. 引言 | 第7-11页 |
·什么是信息检索 | 第7-8页 |
·机器的局限 | 第8页 |
·语义方法与统计方法 | 第8-10页 |
·本文的组织 | 第10-11页 |
2. 信息检索算法概述 | 第11-51页 |
·基本定义 | 第11-16页 |
·文档 | 第11-12页 |
·查询 | 第12页 |
·数据集合 | 第12页 |
·相关性 | 第12-14页 |
·排名 | 第14页 |
·相关性判定 | 第14-15页 |
·主题 | 第15页 |
·查询扩展 | 第15页 |
·相关反馈 | 第15页 |
·Ad Hoc | 第15-16页 |
·评测方法 | 第16-17页 |
·经典布尔模型 | 第17-18页 |
·扩展布尔模型 | 第18-19页 |
·向量空间模型 | 第19-31页 |
·文档的向量化表示 | 第20-21页 |
·索引词的区分能力 | 第21-22页 |
·查询的处理 | 第22-23页 |
·文档相关度的计算 | 第23-24页 |
·规格化权重 | 第24-28页 |
·词权重计算公式总结 | 第28-30页 |
·长文档问题 | 第30-31页 |
·概率检索模型 | 第31-39页 |
·KAPI 系统 | 第31-36页 |
·NQUERY | 第36-39页 |
·语言模型 | 第39-41页 |
·Web 信息检索—链接分析 | 第41-46页 |
·P ageRank 原理分析 | 第41-43页 |
·C LEVER 系统 | 第43-46页 |
·其它信息检索方法 | 第46-51页 |
·签名文件 | 第46-47页 |
·Fuzzy Set | 第47-49页 |
·Latent Semantic Indexing Model | 第49-51页 |
3. 理论与实践 TREC 中的WEB 信息检索 | 第51-68页 |
·引言 | 第51-52页 |
·TREC 2002 Web Track 测试任务 | 第52-63页 |
·任务简介 | 第52-53页 |
·基于文本内容的检索 | 第53-57页 |
·Named Page Finding 子任务 | 第57-62页 |
·Topic Distillation 子任务 | 第62-63页 |
·TREC 之后的实验 | 第63-66页 |
·OKAPI | 第63-64页 |
·伪相关反馈 | 第64-65页 |
·概率检索模型与向量空间模型的结合 | 第65-66页 |
·本章结束语 | 第66-68页 |
4. 基于遗传算法的参数优化 | 第68-88页 |
·信息检索现状 | 第68-69页 |
·遗传算法简介 | 第69-73页 |
·遗传算法的生物学类比 | 第69-70页 |
·遗传算法主要步骤 | 第70-72页 |
·常用算法 | 第72-73页 |
·信息检索中的遗传算法 | 第73-75页 |
·问题求解过程 | 第75-86页 |
·有相关性判定的求解过程 | 第77-81页 |
·无相关性判定的求解过程 | 第81-86页 |
·本章结束语 | 第86-88页 |
5. 信息检索方法在P2P 环境下的应用 | 第88-99页 |
·背景 | 第88-89页 |
·相关工作 | 第89-91页 |
·基于随机复制的方法 | 第91-97页 |
·模拟实验环境 | 第92-93页 |
·覆盖率实验 | 第93-94页 |
·TREC 检索任务在P2P 环境下的测试 | 第94-97页 |
·未来的研究 | 第97-99页 |
6. 总结与展望 | 第99-102页 |
7. 参考文献 | 第102-110页 |
8. 致谢 | 第110-111页 |
9. 作者简历 | 第111-112页 |