《经济研究》折射中国经济发展--对《经济研究》刊载文章的文本挖掘与统计分析
摘要 | 第2-4页 |
ABSTRACT | 第4-6页 |
1 引言 | 第9-21页 |
1.1 论文的研究背景与意义 | 第9-11页 |
1.1.1 研究背景 | 第9-10页 |
1.1.2 研究意义 | 第10-11页 |
1.2 文献综述 | 第11-16页 |
1.2.1 文本挖掘 | 第11-15页 |
1.2.2 《经济研究》的文本挖掘 | 第15页 |
1.2.3 文献评述 | 第15-16页 |
1.3 研究方法与创新点 | 第16-18页 |
1.3.1 研究方法 | 第16-18页 |
1.3.2 创新点 | 第18页 |
1.4 研究内容及研究框架 | 第18-21页 |
1.4.1 研究内容 | 第18-19页 |
1.4.2 研究框架 | 第19-21页 |
2 文本建模相关理论与基础技术概述 | 第21-36页 |
2.1 《经济研究》Web文本挖掘概述 | 第21-23页 |
2.1.1 Web文本挖掘定义 | 第21页 |
2.1.2 网络版《经济研究》数据结构特点 | 第21-22页 |
2.1.3 《经济研究》Web文本挖掘的过程 | 第22-23页 |
2.2 《经济研究》中文分词概述 | 第23-27页 |
2.2.1 中文分词的介绍 | 第24页 |
2.2.2 中文分词的方法 | 第24-25页 |
2.2.3 《经济研究》中文分词工具 | 第25-26页 |
2.2.4 《经济研究》中文分词的歧义处理 | 第26-27页 |
2.3 《经济研究》文本特征提取 | 第27-28页 |
2.4 LDA-AP主题模型 | 第28-36页 |
2.4.1 LDA算法 | 第29-32页 |
2.4.2 AP聚类算法 | 第32-34页 |
2.4.3 LDA-AP主题演化模型 | 第34-36页 |
3 基于《经济研究》文本挖掘的实现与结果分析 | 第36-67页 |
3.1 样本选择与数据处理 | 第36-40页 |
3.1.1 《经济研究》文本数据采集 | 第36-38页 |
3.1.2 文本预处理 | 第38-40页 |
3.2 《经济研究》的历史阶段回顾与内容分析 | 第40-47页 |
3.3 《经济研究》主题的演化分析 | 第47-53页 |
3.3.1 主题建模 | 第47-49页 |
3.3.2 主题内容聚类演化结果与分析 | 第49-51页 |
3.3.3 主题强度的结果与分析 | 第51-53页 |
3.4 核心作者群以及作者研究领域分析 | 第53-67页 |
3.4.1 高产作者群 | 第53-54页 |
3.4.2 外在合作关系分析 | 第54-57页 |
3.4.3 潜在合作关系分析 | 第57-60页 |
3.4.4 核心作者群 | 第60-62页 |
3.4.5 核心作者群研究领域分析 | 第62-67页 |
4 总结与展望 | 第67-70页 |
4.1 研究结论 | 第67-69页 |
4.2 研究展望 | 第69-70页 |
参考文献 | 第70-74页 |
后记 | 第74-75页 |