关于学位论文使用授权的说明 | 第1-6页 |
摘要 | 第6-9页 |
Abstract | 第9-20页 |
第一章 信息检索概述 | 第20-42页 |
·引言 | 第20-23页 |
·四种基本的信息检索模型 | 第23-38页 |
·基于集合论的模型 | 第23-25页 |
·布尔模型 | 第23-24页 |
·布尔模型的几种变体 | 第24页 |
·MMM模型 | 第24页 |
·Paice模型 | 第24-25页 |
·P-norm模型 | 第25页 |
·代数模型 | 第25-31页 |
·向量空间模型 | 第25-28页 |
·广义向量空间模型 | 第28-30页 |
·潜在语义标引模型(latent semantics indexing model,LSI) | 第30页 |
·神经网络模型(Neural Network Model) | 第30-31页 |
·概率模型 | 第31-34页 |
·贝叶斯网络(bayesian) | 第34页 |
·语言模型 | 第34-38页 |
·一元语法模型 | 第35-36页 |
·隐马尔科夫模型(HMM) | 第36页 |
·统计语言翻译模型 | 第36-37页 |
·信息检索的语言模型和贝叶斯决策理论 | 第37-38页 |
·检索模型评价与评测组织 | 第38-39页 |
·模型评价 | 第38页 |
·TREC简介 | 第38-39页 |
·模型的基础理论研究以及理论研究上的ad hoc问题 | 第39-40页 |
·各种模型的实现 | 第40-42页 |
·一般信息检索系统的架构 | 第40页 |
·几个信息检索软件简介 | 第40-42页 |
·smart | 第40页 |
·lemur | 第40-42页 |
第二章 信息检索的NID(NCD)距离与由此导出的模型 | 第42-79页 |
·描述复杂性理论(Kolmogorov's complexity) | 第42-47页 |
·任意性或随机性与不可计算性或非递归性 | 第42页 |
·描述复杂性(Kolmogorov's complexity) | 第42-43页 |
·准测度,描述概率和推理概率 | 第43-45页 |
·描述复杂性(Kolmogorov's comptexity)和距离 | 第45-47页 |
·描述复杂性(Kolmogorov's complexity),归一化绝对距离和信息检索 | 第47-53页 |
·归一化绝对距离 | 第47-49页 |
·压缩概述,有损压缩,无损压缩与信息检索 | 第49-53页 |
·通用压缩算法概述 | 第50-52页 |
·非通用压缩-多媒体数据的压缩 | 第52页 |
·压缩算法和技术目前和将来的发展 | 第52-53页 |
·有损压缩,无损压缩和信息检索 | 第53页 |
·信息检索的NCD模型 | 第53-54页 |
·信息检索的NCD模型的实现 | 第53-54页 |
·信息检索的NCD模型的zlib近似实现和实验 | 第54-66页 |
·实验1 | 第54-58页 |
·实验1的设定 | 第54-57页 |
·实验1的结果 | 第57-58页 |
·实验1的分析 | 第58页 |
·实验2 | 第58-60页 |
·实验2的设定 | 第58页 |
·实验2的结果 | 第58-59页 |
·实验2的分析 | 第59-60页 |
·实验3 | 第60-61页 |
·实验3的设定 | 第60页 |
·实验3的结果 | 第60-61页 |
·实验3的分析 | 第61页 |
·实验4 | 第61-63页 |
·实验4的设定 | 第61-62页 |
·实验4的结果 | 第62页 |
·实验4的分析 | 第62-63页 |
·实验5 | 第63-64页 |
·实验5的设定 | 第63页 |
·实验5的结果 | 第63-64页 |
·实验5的分析 | 第64页 |
·实验6 | 第64-66页 |
·实验6的设定 | 第64-65页 |
·实验6的结果 | 第65页 |
·实验6的分析 | 第65-66页 |
·zlib试验分析 | 第66页 |
·ncd的bzip近似模型与实验 | 第66-73页 |
·bzip近似模型的压缩算法 | 第66-68页 |
·实验7 | 第68-69页 |
·实验7的设定 | 第68页 |
·实验7的结果 | 第68-69页 |
·实验7的分析 | 第69页 |
·实验8 | 第69-71页 |
·实验8的设定 | 第69页 |
·实验8的结果 | 第69-70页 |
·实验8的分析 | 第70-71页 |
·实验9 | 第71-72页 |
·实验9的设定 | 第71页 |
·实验9的结果 | 第71-72页 |
·实验9的分析 | 第72页 |
·bzip试验分析 | 第72-73页 |
·NCD模型一个简单的近似实现 | 第73-76页 |
·实验10 | 第73-75页 |
·实验10的设定 | 第73页 |
·实验10的结果 | 第73-74页 |
·实验10的分析 | 第74-75页 |
·实验11 | 第75-76页 |
·实验11的设定 | 第75页 |
·实验11的结果 | 第75-76页 |
·实验11的分析 | 第76页 |
·结论与将来的工作 | 第76-79页 |
·信息检索的NCD理论 | 第76-77页 |
·NCD模型依照压缩算法的近似实现和试验 | 第77页 |
·NCD模型依照LZ,BWT的近似实现和试验 | 第77页 |
·NCD模型以单词为单位进行压缩的LZ简单实现和试验 | 第77页 |
·信息检索NCD模型将来的进一步工作 | 第77-79页 |
第三章 信息检索的经验模型,NCD距离与NCD距离模型探讨 | 第79-91页 |
·信息检索的形式定义与若干性质 | 第79-80页 |
·信息检索的形式描述 | 第79-80页 |
·向量空间模型与其他经验模型的比较,向量空间模型的假设 | 第80-82页 |
·语言模型和向量空间模型的比较 | 第80-81页 |
·向量空间模型的假设 | 第81页 |
·一个典型的向量空间模型的表示函数与评分函数 | 第81-82页 |
·归一化绝对距离在VSM两个假设之下导出的模型与实验验证 | 第82-87页 |
·归一化绝对距离在向量空间模型的两个假设之下导出的模型 | 第83-84页 |
·实验1 | 第84-86页 |
·实验1的设定 | 第84-85页 |
·实验1的结果 | 第85-86页 |
·实验1的分析 | 第86页 |
·实验2 | 第86-87页 |
·实验2的设定 | 第86页 |
·实验2的结果 | 第86-87页 |
·实验2的分析 | 第87页 |
·向量空间模型与归一化绝对距离的比较 | 第87-89页 |
·向量空间模型与归一化绝对距离 | 第87-89页 |
·结论和将来的工作 | 第89-91页 |
·信息检索结果等价的形式化分析、向量空间模型假设的形式化分析及其前缀复杂性表示 | 第89页 |
·NCD模型在VSM假设之下的近似实现和试验 | 第89-90页 |
·NCD模型中近似取得词语的算法信息或前缀复杂度的方法 | 第90页 |
·经验模型(VSM)和NCD模型的比较和解释 | 第90-91页 |
第四章 信息检索的文档图模型 | 第91-99页 |
·文档图模型与相关的工作 | 第91-92页 |
·文档图模型 | 第91页 |
·我们的图模型和其他机构一些相关的工作 | 第91-92页 |
·离散马尔可夫链、图模型、对阅读过程的建模(词之间,句子之间的连接关系) | 第92-96页 |
·图模型试验 | 第96-97页 |
·实验1 | 第96-97页 |
·实验1的设定 | 第96页 |
·实验1的结果 | 第96-97页 |
·实验1的分析 | 第97页 |
·结论和将来的工作 | 第97-99页 |
第五章 关联模型:简化的实现和试验 | 第99-109页 |
·简单关联模型 | 第99-100页 |
·简单关联模型试验一 | 第100-102页 |
·实验设定 | 第100页 |
·实验结果 | 第100-101页 |
·实验分析 | 第101-102页 |
·简单关联模型试验二 | 第102-104页 |
·实验设定 | 第102页 |
·实验结果 | 第102-103页 |
·实验分析 | 第103-104页 |
·简单关联模型试验三:混合简单关联模型和向量空间模型 | 第104-105页 |
·实验设定 | 第104页 |
·实验结果 | 第104-105页 |
·实验分析 | 第105页 |
·混合实验对应的简单向量空间模型实验 | 第105-107页 |
·实验设定 | 第105-106页 |
·实验结果 | 第106-107页 |
·实验分析 | 第107页 |
·简单关联模型结论和将来进一步的工作 | 第107-109页 |
第六章 经典信息检索模型的相关实验 | 第109-119页 |
·经典信息检索模型的软件实现 | 第109-110页 |
·简单的经典模型检索 | 第109页 |
·带反馈的经典模型检索 | 第109页 |
·rerank检索 | 第109-110页 |
·评测 | 第110页 |
·信息检索的向量空间,okapi,lm模型的检索实验 | 第110-113页 |
·实验1 | 第110-111页 |
·实验1的设定 | 第110页 |
·实验1的结果 | 第110-111页 |
·实验2 | 第111-112页 |
·实验2的设定 | 第111页 |
·实验2的结果 | 第111-112页 |
·实验3 | 第112-113页 |
·实验3的设定 | 第112页 |
·实验3的结果 | 第112-113页 |
·反馈试验 | 第113-115页 |
·实验4 | 第113-114页 |
·实验4的设定 | 第113页 |
·实验4的结果 | 第113-114页 |
·实验5 | 第114-115页 |
·实验5的设定 | 第114页 |
·实验5的结果 | 第114-115页 |
·信息检索模型的rerank实验 | 第115-119页 |
·实验6 | 第115-116页 |
·实验6的设定 | 第115-116页 |
·实验6的结果 | 第116页 |
·实验6的分析 | 第116页 |
·实验7 | 第116-117页 |
·实验7的设定 | 第116-117页 |
·实验7的结果 | 第117页 |
·实验8 | 第117-119页 |
·实验8的设定 | 第117-118页 |
·实验8的结果 | 第118-119页 |
第七章 结论 | 第119-123页 |
·基于kolmogorov complexity的NCD模型,理论和经验模型的解释 | 第119-121页 |
·信息检索的NCD理论 | 第119页 |
·基于kolmogorov complexity的NCD模型的近似实现和试验 | 第119-120页 |
·NCD模型依照压缩算法的近似实现和试验 | 第119-120页 |
·NCD模型在VSM假设之下的近似实现和试验 | 第120页 |
·VSM诸经验摸型和NCD模型的比较和解释 | 第120-121页 |
·近似取得词语的算法信息或前缀复杂度的方法 | 第120页 |
·经验模型(VSM)和NCD模型的比较和解释 | 第120-121页 |
·信息检索结果等价,VSM假设的形式化分析和VSM假设的前缀复杂性表示 | 第121页 |
·信息检索结果等价的形式化分析 | 第121页 |
·向量空间模型假设的形式化分析和前缀复杂性表示 | 第121页 |
·图模型 | 第121-122页 |
·简单关联模型 | 第122-123页 |
参考文献 | 第123-129页 |
致谢 | 第129-130页 |
声明 | 第130-131页 |
附录A 相关数学概念,定理,公式和证明 | 第131-132页 |
A.1 随机性和有效测试的有关概念和定理 | 第131-132页 |
个人简历、在学期间的研究成果及发表的论文 | 第132页 |