面向农村医疗的分布式文本检索关键技术研究
摘要 | 第4-5页 |
ABSTRACT | 第5-6页 |
目录 | 第7-9页 |
第一章 绪论 | 第9-14页 |
1.1 研究背景 | 第9页 |
1.2 研究现状 | 第9-12页 |
1.3 研究内容及特色 | 第12页 |
1.4 论文组织结构 | 第12-14页 |
第二章 分布式文本检索关键技术研究 | 第14-28页 |
2.1 分布式检索模型 | 第14-18页 |
2.1.1 基于语义的检索模型 | 第14页 |
2.1.2 基于统计的检索模型 | 第14-16页 |
2.1.3 分布式隐含语义检索模型 | 第16-18页 |
2.2 权重计算公式 | 第18-20页 |
2.2.1 局部权重计算公式 | 第19页 |
2.2.2 全局权重计算公式 | 第19-20页 |
2.3 分布式创建索引 | 第20-23页 |
2.3.1 创建索引 | 第20-21页 |
2.3.2 Hadoop分布式框架 | 第21页 |
2.3.3 MapReduce编程 | 第21-23页 |
2.4 分词工具 | 第23-24页 |
2.5 检索结果的评价指标 | 第24-28页 |
2.5.1 单个查询的评价指标 | 第25-26页 |
2.5.2 多个查询的评价指标 | 第26-28页 |
第三章 分布式文本检索框架的设计 | 第28-41页 |
3.1 框架结构 | 第28-29页 |
3.2 文档分词 | 第29-30页 |
3.3 分布式创建索引 | 第30-33页 |
3.3.1 分布式倒排索引 | 第30-32页 |
3.3.2 索引更新 | 第32-33页 |
3.4 权重计算公式改进 | 第33-35页 |
3.5 分布式隐含语义检索 | 第35-39页 |
3.5.1 分布式奇异值分解 | 第35-37页 |
3.5.2 隐含语义检索 | 第37-39页 |
3.6 结果显示 | 第39-41页 |
第四章 分布式文本检索框架的技术实现 | 第41-51页 |
4.1 分词模块 | 第41-42页 |
4.2 分布式创建索引模块 | 第42-44页 |
4.3 改进后的权重计算模块 | 第44-47页 |
4.4 分布式隐含语义检索模块 | 第47-49页 |
4.5 结果显示模块 | 第49-51页 |
第五章 测试与分析 | 第51-64页 |
5.1 实验环境搭建 | 第51-53页 |
5.1.1 Hadoop安装 | 第51-52页 |
5.1.2 mahout安装 | 第52-53页 |
5.1.3 实验环境参数 | 第53页 |
5.2 实验过程及结果分析 | 第53-64页 |
5.2.1 改进后的权重计算公式效果分析 | 第55-60页 |
5.2.2 分布式隐含语义检索模型性能分析 | 第60-62页 |
5.2.3 分布式创建索引性能分析 | 第62页 |
5.2.4 分布式文本检索框架整体性能分析 | 第62-64页 |
第六章 总结与展望 | 第64-65页 |
参考文献 | 第65-68页 |
致谢 | 第68-69页 |
作者攻读学位期间发表的学术论文目录 | 第69页 |