基于文本挖掘的文本情绪分类
摘要 | 第3-4页 |
ABSTRACT | 第4-5页 |
第一章 引言 | 第8-22页 |
第一节 研究背景 | 第8-13页 |
一、对“大数据”的讨论 | 第8-9页 |
二、金融大数据与互联网大数据的介绍 | 第9-10页 |
三、一种存在于互联网的金融大数据:股吧文本数据 | 第10-11页 |
四、文本挖掘 | 第11-13页 |
第二节 提出问题 | 第13-17页 |
一、研究对象 | 第13-14页 |
二、相关金融理论与实际应用 | 第14-15页 |
三、研究目的 | 第15页 |
四、研究思路 | 第15-17页 |
第三节 本文研究内容及研究意义 | 第17-18页 |
一、研究内容 | 第17-18页 |
二、研究意义 | 第18页 |
第四节 国内外研究现状 | 第18-22页 |
一、文本挖掘与文本分类 | 第18-19页 |
二、分类模型 | 第19页 |
三、不平衡分类理论 | 第19-20页 |
四、降维理论 | 第20页 |
五、交叉验证 | 第20页 |
六、非参数假设检验 | 第20-22页 |
第二章 理论及方法介绍 | 第22-37页 |
第一节 建模思路分析 | 第22-28页 |
一、文本数据的收集 | 第22-23页 |
二、文本特征数据提取 | 第23-25页 |
三、提出建模思路 | 第25-28页 |
第二节 相关方法介绍 | 第28-37页 |
一、分类模型 | 第28-31页 |
二、降维方法 | 第31-32页 |
三、不平衡数据 | 第32-33页 |
四、交叉验证 | 第33-34页 |
五、非参数假设检验 | 第34-37页 |
第三章 数据分析及建模 | 第37-44页 |
第一节 数据收集 | 第37-38页 |
第二节 数据集探索性分析 | 第38-39页 |
第三节 模型建立 | 第39-44页 |
一、建立分类树模型 | 第40-41页 |
二、降维 | 第41-42页 |
三、不平衡分类问题的考虑 | 第42页 |
四、随机森林与SVD降维分类树的比较 | 第42-43页 |
五、检验随机森林模型有效性 | 第43-44页 |
第四章 结论 | 第44-46页 |
参考文献 | 第46-50页 |
附录A | 第50-51页 |
附录B | 第51-56页 |
致谢 | 第56-57页 |
在读期间研究成果 | 第57页 |