基于文本挖掘的制造业上市公司网络金融信息分析
内容摘要 | 第5-6页 |
Abstract | 第6-7页 |
第1章 导论 | 第11-21页 |
1.1 研究背景 | 第11-12页 |
1.2 研究意义 | 第12页 |
1.3 文献综述 | 第12-17页 |
1.3.1 文本的情感倾向性分析研究现状 | 第12-14页 |
1.3.2 金融文本分析研究现状 | 第14-17页 |
1.4 论文创新点 | 第17-18页 |
1.5 论文的研究内容以及结构安排 | 第18-21页 |
1.5.1 研究内容 | 第18-19页 |
1.5.2 文章结构 | 第19-21页 |
第2章 相关理论基础 | 第21-28页 |
2.1 中文分词及词性标注技术 | 第21-23页 |
2.1.1 中文分词技术 | 第21-23页 |
2.1.2 词性标注技术 | 第23页 |
2.2 特征选择 | 第23-25页 |
2.2.1 词频 | 第23-24页 |
2.2.2 文档频率 | 第24页 |
2.2.3 信息增益 | 第24页 |
2.2.4 卡方检验 | 第24-25页 |
2.2.5 互信息 | 第25页 |
2.3 文本的表示方法 | 第25-27页 |
2.3.1 向量空间模型 | 第26-27页 |
2.4 相关性分析 | 第27-28页 |
2.4.1 Pearson相关检验 | 第27页 |
2.4.2 Spearman相关系数分析 | 第27-28页 |
第3章 构建金融情感词典 | 第28-33页 |
3.1 情感词典概述 | 第28-33页 |
3.1.1 极性情感词典 | 第28-30页 |
3.1.2 程度副词词典 | 第30页 |
3.1.3 否定词典 | 第30-31页 |
3.1.4 停用词词典 | 第31-33页 |
第4章 实证分析 | 第33-50页 |
4.1 研究工具 | 第33页 |
4.2 研究对象 | 第33-36页 |
4.2.1 网络金融信息 | 第33页 |
4.2.2 财务指标选择 | 第33-34页 |
4.2.3 公司选择 | 第34-36页 |
4.3 上市公司金融信息采集 | 第36-38页 |
4.4 上市公司金融信息文本预处理及情感值分析 | 第38-40页 |
4.5 网络金融信息指标与财务指标的相关性分析 | 第40-44页 |
4.5.1 正常公司相关性分析 | 第40-42页 |
4.5.2 ST公司相关性分析 | 第42-44页 |
4.6 上市公司盈利状况分析 | 第44-50页 |
4.6.1 描述性分析 | 第45-46页 |
4.6.2 模型估计 | 第46-47页 |
4.6.3 上市公司盈利状况预测模型检验 | 第47-50页 |
第5章 结论与展望 | 第50-52页 |
5.1 结论 | 第50-51页 |
5.2 不足与展望 | 第51-52页 |
参考文献 | 第52-58页 |
后记 | 第58页 |