专利文献主题发现方法的比较研究--以汽车零部件领域为例
摘要 | 第4-5页 |
Abstract | 第5页 |
1 绪论 | 第8-14页 |
1.1 问题的提出及研究意义 | 第8-9页 |
1.2 国内外研究综述 | 第9-12页 |
1.2.1 国内外主题发现研究现状 | 第10-11页 |
1.2.2 文本挖掘技术用于主题发现 | 第11-12页 |
1.3 研究思路与主要内容 | 第12-14页 |
2 三种主题发现方法原理及使用流程的比较 | 第14-25页 |
2.1 共词分析 | 第14-16页 |
2.1.1 共词分析 | 第14页 |
2.1.2 共词分析的流程 | 第14-15页 |
2.1.3 共词分析的改进 | 第15-16页 |
2.2 k-means聚类 | 第16-21页 |
2.2.1 k-means算法 | 第16-17页 |
2.2.2 k-means聚类分析的流程 | 第17-20页 |
2.2.3 k-means算法的改进 | 第20-21页 |
2.3 LDA主题模型 | 第21-25页 |
2.3.1 LDA模型 | 第21-22页 |
2.3.2 LDA主题分析的流程 | 第22-23页 |
2.3.3 LDA模型的改进 | 第23-25页 |
3 三种主题发现方法适用性的比较 | 第25-41页 |
3.1 科学文献 | 第25-32页 |
3.1.1 科学文献文本特征 | 第25-26页 |
3.1.2 科学文献中的主题发现 | 第26-32页 |
3.2 专利文献 | 第32-37页 |
3.2.1 专利文献的文本特征 | 第32-33页 |
3.2.2 专利文献中的主题发现 | 第33-37页 |
3.3 网络数据 | 第37-39页 |
3.3.1 网络数据的文本特征 | 第37页 |
3.3.2 网络数据中的主题发现 | 第37-39页 |
3.4 三种主题发现适用范围 | 第39-40页 |
3.5 本章小结 | 第40-41页 |
4 三种主题发现方法有效性的比较 | 第41-45页 |
4.1 共词分析法的优势和局限性 | 第41-42页 |
4.2 k-means的优势和局限性 | 第42-44页 |
4.3 LDA模型的优势和局限性 | 第44-45页 |
5 汽车零部件领域专利文献主题发现 | 第45-53页 |
5.1 汽车零部件领域背景 | 第45页 |
5.2 数据来源及实验流程 | 第45-48页 |
5.3 实验结果与分析 | 第48-51页 |
5.3.1 基于共词分析法的专利主题发现 | 第48-49页 |
5.3.2 基于LDA的专利主题发现 | 第49-51页 |
5.4 LDA主题发现与共词分析的结果对比 | 第51-53页 |
结论 | 第53-54页 |
参考文献 | 第54-59页 |
攻读硕士学位期间发表学术论文情况 | 第59-60页 |
致谢 | 第60-61页 |