摘要 | 第4-5页 |
Abstract | 第5页 |
第一章 绪论 | 第10-20页 |
1.1 研究背景与意义 | 第10-12页 |
1.2 研究现状 | 第12-18页 |
1.2.1 主题模型 | 第12-14页 |
1.2.2 主题演化建模方法 | 第14-16页 |
1.2.3 主题模型在财经文本中的应用 | 第16-18页 |
1.3 研究内容与框架 | 第18-19页 |
1.4 研究创新 | 第19-20页 |
第二章 研究方法 | 第20-30页 |
2.1 词袋模型假设 | 第20-21页 |
2.2 LDA主题模型 | 第21-26页 |
2.3 秩相关系数 | 第26-30页 |
第三章 数据获取与处理 | 第30-48页 |
3.1 财经文本范围与信息源选择 | 第30-33页 |
3.2 财经文本爬取与分词 | 第33-39页 |
3.3 财经文本分析与清洗 | 第39-43页 |
3.4 财经文本时间窗口划分 | 第43-48页 |
第四章 最优主题数的确定与主题相似度的度量 | 第48-62页 |
4.1 最优主题数的确定 | 第48-54页 |
4.1.1 现有常用主题数确定方法 | 第48-49页 |
4.1.2 基于最小化冗余主题数的最优主题数的确定 | 第49-51页 |
4.1.3 效果对比 | 第51-54页 |
4.2 主题相似度的度量 | 第54-62页 |
4.2.1 概率分布相似度度量中存在的问题 | 第54-57页 |
4.2.2 基于秩相关系数的主题相似度的度量 | 第57-59页 |
4.2.3 效果对比 | 第59-62页 |
第五章 财经文本主题演化分析及其特征 | 第62-81页 |
5.1 财经文本主题演化案例分析—一以上汽集团为例 | 第62-79页 |
5.1.1 主题演化分析方法与可视化 | 第62-65页 |
5.1.2 时间窗口划分与主题模型构建 | 第65-66页 |
5.1.3 主题演化分析 | 第66-76页 |
5.1.4 主题的持续性 | 第76-77页 |
5.1.5 主题的内容变化 | 第77-79页 |
5.2 财经文本主题演化特征 | 第79-81页 |
第六章 总结 | 第81-83页 |
6.1 研究结论 | 第81-82页 |
6.2 不足与展望 | 第82-83页 |
参考文献 | 第83-87页 |
致谢 | 第87页 |