股票预测中的文本大数据挖掘研究
摘要 | 第4-5页 |
Abstract | 第5-6页 |
第一章 绪论 | 第10-16页 |
1.1 研究背景 | 第10-11页 |
1.2 研究现状 | 第11-12页 |
1.3 目前存在的主要问题 | 第12-13页 |
1.4 论文的主要内容 | 第13-14页 |
1.5 论文的组织结构 | 第14-16页 |
第二章 大数据处理系统架构的分析与设计 | 第16-26页 |
2.1 大数据处理技术概述 | 第16-18页 |
2.1.1 大数据采集技术概述 | 第16页 |
2.1.2 大数据存储技术概述 | 第16-17页 |
2.1.3 大数据挖掘技术概述 | 第17-18页 |
2.2 系统分析 | 第18-21页 |
2.2.1 大数据采集流程分析 | 第18-20页 |
2.2.2 大数据挖掘流程分析 | 第20-21页 |
2.3 系统架构设计 | 第21-24页 |
2.3.1 文本大数据处理架构设计 | 第21-23页 |
2.3.2 文本大数据处理流程分析 | 第23-24页 |
2.3.3 股票预测系统工作流程分析 | 第24页 |
2.4 关键技术 | 第24-25页 |
2.5 本章小结 | 第25-26页 |
第三章 基于股票本体的主题爬虫研究 | 第26-40页 |
3.1 本体概述 | 第26-27页 |
3.1.1 本体的定义 | 第26页 |
3.1.2 本体的分类 | 第26-27页 |
3.2 本体构建 | 第27-30页 |
3.2.1 本体的构建原则 | 第27页 |
3.2.2 本体的构建方法 | 第27-29页 |
3.2.3 本体构建工具 | 第29页 |
3.2.4 金融领域股票本体的构建 | 第29-30页 |
3.3 基于股票本体的主题爬虫研究 | 第30-38页 |
3.3.1 网络爬虫的基本原理及结构 | 第30-32页 |
3.3.2 语义相似度计算 | 第32-34页 |
3.3.3 主题爬虫的爬行策略 | 第34-35页 |
3.3.4 主题爬虫工作流程 | 第35-37页 |
3.3.5 主题爬虫的设计思路 | 第37页 |
3.3.6 主题爬虫性能评价 | 第37-38页 |
3.4 实验结果与分析 | 第38-39页 |
3.5 本章小结 | 第39-40页 |
第四章 多数据源股票预测模型研究 | 第40-52页 |
4.1 相关理论概述 | 第40-43页 |
4.1.1 向量空间模型 | 第40-41页 |
4.1.2 支持向量机 | 第41-43页 |
4.2 情感分析 | 第43-46页 |
4.2.1 股评数据来源 | 第43-44页 |
4.2.2 文本预处理 | 第44页 |
4.2.3 文本表示 | 第44页 |
4.2.4 特征提取 | 第44-45页 |
4.2.5 文本情感分类 | 第45-46页 |
4.2.6 投资者情绪指数 | 第46页 |
4.3 多数据源股票预测模型 | 第46-51页 |
4.3.1 股票数据来源 | 第46-47页 |
4.3.2 股票指标计算 | 第47-48页 |
4.3.3 支持向量机核函数 | 第48-49页 |
4.3.4 股票预测模型 | 第49-51页 |
4.4 实验结果及分析 | 第51页 |
4.5 本章小结 | 第51-52页 |
第五章 系统实现 | 第52-60页 |
5.1 系统开发环境及工具 | 第52页 |
5.2 系统功能简介 | 第52-54页 |
5.3 系统需求分析 | 第54-56页 |
5.3.1 用例图设计 | 第54-55页 |
5.3.2 类图设计 | 第55-56页 |
5.4 系统主要模块的实现 | 第56-59页 |
5.4.1 股评信息采集 | 第56-57页 |
5.4.2 股票指标计算 | 第57页 |
5.4.3 股评信息统计 | 第57-58页 |
5.4.4 股评内容查询 | 第58-59页 |
5.4.5 潜力股推荐 | 第59页 |
5.5 本章小结 | 第59-60页 |
总结与展望 | 第60-62页 |
本文工作总结 | 第60-61页 |
进一步工作展望 | 第61-62页 |
参考文献 | 第62-68页 |
攻读硕士学位期间取得的学术成果 | 第68-70页 |
参与的科研项目 | 第68-70页 |
致谢 | 第70页 |