基于股吧文本的主题挖掘及其股票投资应用

摘要	第5-6页
Abstract	第6-7页
第一章绪论	第10-17页
1.1 本文的研究背景与意义	第10-11页
1.2 国内外研究综述	第11-14页
1.2.1 基于社交媒体的主题挖掘研究综述	第11-13页
1.2.2 基于主题投资的选股策略研究综述	第13-14页
1.3 本文创新点与章节安排	第14-16页
1.4 本章小结	第16-17页
第二章预备知识	第17-38页
2.1 获取文本的相关技术	第17-22页
2.1.1 网络爬虫简介	第17-18页
2.1.2 Python爬虫	第18-22页
2.2 文本预处理的相关方法	第22-24页
2.2.1 汉字简繁体转换	第23页
2.2.2 中文分词	第23-24页
2.2.3 过滤停用词	第24页
2.2.4 特征提取	第24页
2.3 主题挖掘的相关理论	第24-37页
2.3.1 主题挖掘	第24-26页
2.3.2 LDA基础	第26-29页
2.3.3 LDA简介	第29-37页
2.4 本章小结	第37-38页
第三章基于股吧文本的主题挖掘	第38-47页
3.1 数据获取	第38-39页
3.1.1 数据来源	第38页
3.1.2 数据爬取	第38-39页
3.1.3 数据保存	第39页
3.2 数据清洗	第39-41页
3.2.1 汉字简繁体转换	第39-40页
3.2.2 分词、过滤停用词	第40-41页
3.3 主题挖掘	第41-46页
3.3.1 LDA算法	第41-44页
3.3.2 文本聚类算法	第44-46页
3.3.3 算法比较	第46页
3.4 本章小结	第46-47页
第四章基于主题挖掘的股票投资应用	第47-67页
4.1 多因子选股策略的相关理论	第47-51页
4.1.1 CAPM模型	第47-48页
4.1.2 APT模型	第48页
4.1.3 Fama-Freach三因子模型	第48-49页
4.1.4 多因子策略评价指标	第49-51页
4.2 构建主题热度因子	第51-56页
4.2.1 构建主题热度因子	第51-54页
4.2.2 主题热度因子有效性检验	第54-56页
4.3 多因子选股策略构建	第56-66页
4.3.1 构建多因子库	第56-57页
4.3.2 建立逻辑回归选股模型	第57-60页
4.3.3 配资和止损	第60页
4.3.4 策略构建	第60-64页
4.3.5 添加主题热度因子前后策略效果对比	第64-66页
4.4 本章小结	第66-67页
结论	第67-69页
参考文献	第69-73页
攻读硕士学位期间取得的研究成果	第73-74页
致谢	第74-75页
附录	第75-77页
附件	第77页