基于数据集特征的伪相关反馈中平衡参数自调节方法研究
摘要 | 第4-5页 |
Abstract | 第5页 |
第一章 绪论 | 第8-11页 |
1.1 研究背景及国内外研究现状 | 第8-10页 |
1.2 主要探究内容以及论文结构 | 第10-11页 |
第二章 文本信息检索及相关反馈介绍 | 第11-22页 |
2.1 文本信息检索 | 第11-16页 |
2.1.1 文本信息检索的定义 | 第11-12页 |
2.1.2 重要检索模型 | 第12-16页 |
2.2 相关反馈技术的有关研究 | 第16-22页 |
2.2.1 相关反馈分类 | 第16-17页 |
2.2.2 相关反馈算法 | 第17-22页 |
第三章 基于数据集的特征分析 | 第22-29页 |
3.1 查询词的信息含量 | 第22-25页 |
3.1.1 查询词的信息分布 | 第22-23页 |
3.1.2 查询词跨度 | 第23页 |
3.1.3 查询词频的倒排信息 | 第23-24页 |
3.1.4 查询词之间的互信息 | 第24-25页 |
3.1.5 查询词的信息熵 | 第25页 |
3.2 反馈文档的可靠性 | 第25-27页 |
3.2.1 反馈文档的清晰性 | 第25-26页 |
3.2.2 反馈文档中低频词汇的含量 | 第26页 |
3.2.3 反馈文档的文档长度离散度 | 第26-27页 |
3.3 候选扩展词的可靠性 | 第27-29页 |
3.3.1 扩展词与原始查询词之间的互信息 | 第28页 |
3.3.2 扩展词的信息熵 | 第28页 |
3.3.3 扩展词中低频词汇含量 | 第28-29页 |
第四章 实验设置与结果分析 | 第29-46页 |
4.1 实验数据及工具 | 第29-32页 |
4.1.1 实验数据介绍 | 第29-32页 |
4.1.2 查询评估工具 | 第32页 |
4.2 检索流程 | 第32-39页 |
4.2.1 实验设置 | 第33页 |
4.2.2 建立索引 | 第33-35页 |
4.2.3 检索过程 | 第35-37页 |
4.2.4 模型评估 | 第37-39页 |
4.3 预测平衡参数的方法 | 第39页 |
4.3.1 逻辑回归 | 第39页 |
4.4 实验结果及分析 | 第39-46页 |
4.4.1 平衡参数的敏感性 | 第39-41页 |
4.4.2 相关性分析 | 第41-43页 |
4.4.3 预测模型 | 第43-44页 |
4.4.4 性能比较 | 第44-46页 |
第五章 结论与展望 | 第46-48页 |
参考文献 | 第48-55页 |
发表论文和参加科研情况说明 | 第55-56页 |
致谢 | 第56-57页 |