中文摘要 | 第5-7页 |
Abstract | 第7-8页 |
目录 | 第9-13页 |
图目录 | 第13-14页 |
表目录 | 第14-15页 |
1 绪论 | 第15-36页 |
1.1 研究背景与意义 | 第15-18页 |
1.2 国内外研究现状 | 第18-31页 |
1.2.1 基于文本单元聚类的主题发现 | 第18-20页 |
1.2.2 基于共词分析的主题发现 | 第20-21页 |
1.2.3 基于数据库内容结构分析的主题发现 | 第21-23页 |
1.2.4 基于概率主题模型的潜在主题发现 | 第23-26页 |
1.2.5 小结与评述 | 第26-31页 |
1.3 研究目的与研究问题 | 第31-32页 |
1.4 研究方法与技术路线 | 第32-34页 |
1.4.1 研究方法 | 第32-33页 |
1.4.2 技术路线 | 第33-34页 |
1.5 特色与创新点 | 第34页 |
1.6 论文的组织结构 | 第34-36页 |
2 文本主题发现的理论基础 | 第36-43页 |
2.1 文本挖掘 | 第36-40页 |
2.1.1 文本挖掘概述 | 第36页 |
2.1.2 文本的向量空间表示 | 第36-37页 |
2.1.3 文本特征选择与提取 | 第37-40页 |
2.2 知识发现 | 第40-43页 |
2.2.1 知识发现概述 | 第40-41页 |
2.2.2 聚类知识发现 | 第41-43页 |
3 潜在主题可视化的基本原理和流程 | 第43-73页 |
3.1 词汇集聚与潜在主题的表示 | 第43-53页 |
3.1.1 基于文本单元集聚的主题发现 | 第43-45页 |
3.1.2 词汇集聚与潜在主题的发现和表示 | 第45-47页 |
3.1.3 潜在主题的定义 | 第47-49页 |
3.1.4 潜在主题与相关概念辨析 | 第49-53页 |
3.2 MDS可视化与潜在主题的挖掘和展示 | 第53-63页 |
3.2.1 MDS用于潜在主题可视化的可行性 | 第53-61页 |
3.2.2 MDS用于潜在主题可视化的优势 | 第61-63页 |
3.3 潜在主题可视化的基本流程 | 第63-72页 |
3.3.1 潜在主题可视化的总体思路 | 第63-64页 |
3.3.2 文本分词和预处理 | 第64-66页 |
3.3.3 词条在转置向量空间中的表示 | 第66-67页 |
3.3.4 邻近关系的计算与提取 | 第67-68页 |
3.3.5 MDS降维和投影 | 第68-71页 |
3.3.6 潜在主题的表示 | 第71页 |
3.3.7 潜在主题可视化的效果评价 | 第71-72页 |
3.4 小结与讨论 | 第72-73页 |
4 潜在主题可视化的方法 | 第73-94页 |
4.1 扎根理论与潜在主题可视化的融合 | 第73-83页 |
4.1.1 潜在主题可视化中的难点 | 第73-74页 |
4.1.2 扎根理论概述 | 第74-76页 |
4.1.3 开放式编码技术的引入 | 第76-78页 |
4.1.4 扎根性思想的启示 | 第78页 |
4.1.5 融入扎根思想和方法的可行性 | 第78-79页 |
4.1.6 扎根理论的融入与潜在主题可视化的流程再造 | 第79-82页 |
4.1.7 潜在主题可视化对扎根理论的流程再造 | 第82-83页 |
4.2 潜在主题可视化中的情景模型 | 第83-86页 |
4.2.1 潜在主题及其词条的情景依赖特性 | 第83-84页 |
4.2.2 潜在主题可视化中的情景模型 | 第84-85页 |
4.2.3 情景模型的启示 | 第85-86页 |
4.3 潜在主题可视化的方法设计 | 第86-93页 |
4.3.1 邻近矩阵的定义及其在潜在主题可视化中的分析方法 | 第86-87页 |
4.3.2 质心邻近矩阵的定义及其在潜在主题可视化中的分析方法 | 第87-88页 |
4.3.3 属性叠加邻近矩阵的定义及其在潜在主题可视化中的分析方法 | 第88-90页 |
4.3.4 潜在主题可视化的流程优化 | 第90-92页 |
4.3.5 潜在主题可视化方法在不同性质文本集中的应用策略 | 第92-93页 |
4.4 小结与讨论 | 第93-94页 |
5 潜在主题可视化在上市公司风险识别中的应用 | 第94-150页 |
5.1 引言 | 第94-97页 |
5.1.1 研究目的 | 第94页 |
5.1.2 研究意义 | 第94-95页 |
5.1.3 上市公司知识发现的研究现状 | 第95-97页 |
5.2 数据来源与处理 | 第97-106页 |
5.2.1 数据来源 | 第97-98页 |
5.2.2 章节标题的开放式编码 | 第98-100页 |
5.2.3 编码后数据的特征分析 | 第100-103页 |
5.2.4 文本分词和预处理 | 第103页 |
5.2.5 特征选择与提取 | 第103-104页 |
5.2.6 构造输入矩阵 | 第104-106页 |
5.3 基于邻近矩阵的潜在主题可视化 | 第106-134页 |
5.4 基于质心邻近矩阵的潜在主题可视化 | 第134-136页 |
5.5 基于属性叠加邻近矩阵的潜在主题可视化 | 第136-145页 |
5.6 结果评价 | 第145-147页 |
5.7 小结与讨论 | 第147-150页 |
6 总结与展望 | 第150-155页 |
6.1 本文的主要工作 | 第150-153页 |
6.2 研究的不足和局限性 | 第153-154页 |
6.3 下一步的工作 | 第154-155页 |
参考文献 | 第155-160页 |
附录 | 第160-162页 |
研究成果 | 第162-163页 |
致谢 | 第163页 |