摘要 | 第4-5页 |
ABSTRACT | 第5-6页 |
第1章 绪论 | 第10-18页 |
1.1 课题背景及研究目的和意义 | 第10-12页 |
1.1.1 课题背景 | 第10页 |
1.1.2 课题研究目的及意义 | 第10-12页 |
1.2 相关领域的进展及研究现状 | 第12-15页 |
1.2.1 大数据存储技术研究现状 | 第12-13页 |
1.2.2 全文检索技术研究现状 | 第13-14页 |
1.2.3 跨领域推荐技术研究现状 | 第14-15页 |
1.3 本文的主要研究内容 | 第15-16页 |
1.4 本文的组织结构 | 第16-18页 |
第2章 系统的需求分析与总体架构设计 | 第18-32页 |
2.1 存储检索架构的选取 | 第18-23页 |
2.1.1 关系型存储架构 | 第18页 |
2.1.2 非关系型存储架构 | 第18-19页 |
2.1.3 全文实时检索架构 | 第19-20页 |
2.1.4 各检索平台性能对比实验 | 第20-23页 |
2.2 系统的需求分析与总体设计 | 第23-26页 |
2.2.1 存储与检索架构的功能性需求分析 | 第24-25页 |
2.2.2 存储与检索架构的非功能性需求分析 | 第25-26页 |
2.3 基于HADOOP和ELASTICSEARCH的总体架构设计 | 第26-31页 |
2.3.1 基于Hadoop的存储与计算平台 | 第26-28页 |
2.3.2 基于Elastic Search的检索平台 | 第28-30页 |
2.3.3 系统的总体架构设计 | 第30-31页 |
2.4 本章小结 | 第31-32页 |
第3章 互联网信息数据存储与检索技术优化 | 第32-49页 |
3.1 互联网信息数据特征分析 | 第32页 |
3.2 非结构化文档同构化方法 | 第32-34页 |
3.2.1 同构化解析及向量化存储方法 | 第32-34页 |
3.2.2 实验结果及分析 | 第34页 |
3.3 基于ELASTICSEARCH集群的检索优化研究 | 第34-44页 |
3.3.1 操作系统优化 | 第35-36页 |
3.3.2 Elastic Search系统优化 | 第36-38页 |
3.3.3 中文分词算法优化 | 第38-39页 |
3.3.4 Elastic Search索引优化 | 第39-41页 |
3.3.5 检索性能优化实验结果 | 第41-44页 |
3.4 基于互联网相似新闻的去重存储优化 | 第44-47页 |
3.4.1 新闻相似度匹配算法流程 | 第44-47页 |
3.4.2 实验测试结果 | 第47页 |
3.5 本章小结 | 第47-49页 |
第4章 跨领域信息推荐技术研究 | 第49-65页 |
4.1 本文主要数据信息来源 | 第49-50页 |
4.1.1 新闻信息采集 | 第49页 |
4.1.2 微博信息采集 | 第49-50页 |
4.2 基于新闻文本的关键词提取及分类算法研究与实现 | 第50-55页 |
4.2.1 新闻文本关键词提取算法 | 第50-51页 |
4.2.2 新闻文本分类算法研究 | 第51-53页 |
4.2.3 分类算法优化及实验结果 | 第53-55页 |
4.3 跨领域信息推荐算法研究与实现 | 第55-64页 |
4.3.1 总体方案设计 | 第56页 |
4.3.2 基于微博内容的新闻文本推荐算法 | 第56-60页 |
4.3.3 基于用户群体特征的协同过滤推荐算法 | 第60-62页 |
4.3.4 实验与分析 | 第62-64页 |
4.4 本章小结 | 第64-65页 |
第5章 互联网信息信息检索与推荐系统实现 | 第65-73页 |
5.1 系统总体架构设计 | 第65-66页 |
5.2 系统模块性能对比实验 | 第66-68页 |
5.2.1 全文检索性能对比测试 | 第66-67页 |
5.2.2 新闻分类实验结果 | 第67-68页 |
5.3 系统界面及整体功能展示 | 第68-72页 |
5.3.1 检索系统部署与状态管理 | 第69-70页 |
5.3.2 数据向量搜索展示 | 第70-71页 |
5.3.3 个性化推荐结果展示 | 第71-72页 |
5.4 本章小结 | 第72-73页 |
结论 | 第73-74页 |
参考文献 | 第74-80页 |
致谢 | 第80页 |