摘要 | 第1-6页 |
ABSTRACT | 第6-8页 |
目录 | 第8-10页 |
图表目录 | 第10-14页 |
第一章 引言 | 第14-27页 |
·信息检索概述 | 第14-15页 |
·信息检索经典模型 | 第15-17页 |
·基于相似性的模型 | 第16页 |
·概率模型(Probabilistic Model) | 第16页 |
·推理网络模型(Inference Network) | 第16-17页 |
·信息检索评价指标 | 第17-18页 |
·本文所要研究的问题 | 第18-27页 |
·前期工作 | 第19-23页 |
·本文所做的工作 | 第23-27页 |
第二章 关键理论技术 | 第27-33页 |
·传统语言模型在信息检索中的应用 | 第27-28页 |
·隐马尔可夫模型 | 第28-33页 |
·马尔可夫链(Markov Model Chain) | 第28-29页 |
·隐马尔可夫模型(Hidden Markov Model) | 第29-33页 |
第三章 基于隐马尔可夫模型的权重分配方法 | 第33-39页 |
·基于隐马尔可夫模型的语义权重分配 | 第33-35页 |
·可观察特征的构造 | 第35-36页 |
·将权重级别映射为实值的权重 | 第36-38页 |
·扩展后的信息检索语言模型 | 第38-39页 |
第四章 实验 | 第39-67页 |
·实验系统搭建 | 第39-42页 |
·Indri检索引擎 | 第40页 |
·Indri Query Language | 第40页 |
·Standford Part Of Speech Tagger | 第40-42页 |
·训练与测试集的构建 | 第42-43页 |
·HMM权重训练集的构建 | 第42-43页 |
·统计模型平滑 | 第43-45页 |
·添加平滑方法(Additive Smoothing) | 第44页 |
·Good-Turing估计(Good-Turing Estimate) | 第44-45页 |
·实验结果及分析 | 第45-67页 |
·训练集标注有效性验证 | 第47页 |
·阶数与元数的关系 | 第47-58页 |
·不同测试集的性能提升分析 | 第58-59页 |
·关于二阶样本相对够用,三阶样本稀疏的验证 | 第59-63页 |
·与多条基线对比以及与最先进方法的差距 | 第63-66页 |
·权重搭配有用性验证 | 第66-67页 |
第五章 结论与未来工作 | 第67-69页 |
·创新点 | 第67页 |
·实验效果 | 第67页 |
·不足与改进 | 第67-68页 |
·工作展望 | 第68-69页 |
参考文献 | 第69-74页 |
附录 | 第74-94页 |
致谢 | 第94-95页 |
攻读学位期间发表的学术论文目录 | 第95页 |