摘要 | 第2-3页 |
Abstract | 第3-4页 |
1 绪论 | 第7-16页 |
1.1 研究背景及意义 | 第7-9页 |
1.2 国内外研究现状 | 第9-14页 |
1.2.1 关键词抽取国内外研究现状 | 第10-12页 |
1.2.2 知识关联研究现状分析 | 第12-13页 |
1.2.3 面临的挑战 | 第13-14页 |
1.3 本文的结构和技术路线 | 第14-16页 |
2 相关概念与理论 | 第16-27页 |
2.1 主题模型 | 第16-19页 |
2.1.1 主题模型的生成 | 第16-18页 |
2.1.2 LDA主题模型 | 第18-19页 |
2.2 Word2vec词向量模型 | 第19-21页 |
2.3 Sentence2vec句向量模型 | 第21页 |
2.4 TextRank算法 | 第21-23页 |
2.5 LDA2Vec模型 | 第23-27页 |
3 在线评论分词处理 | 第27-35页 |
3.1 在线评论文本特征 | 第27-28页 |
3.2 新词和未登录词识别方法 | 第28-32页 |
3.2.1 单字新词和未登录词识别 | 第29-31页 |
3.2.2 多词表达式识别 | 第31-32页 |
3.3 在线评论文本分词及实验分析 | 第32-35页 |
4 基于改进TextRank算法的中文文本关键词抽取 | 第35-43页 |
4.1 引言 | 第35-36页 |
4.2 改进的TextRank算法 | 第36-40页 |
4.2.1 主题影响力计算 | 第37-38页 |
4.2.2 词汇相似度矩阵计算 | 第38页 |
4.2.3 概率转移矩阵构建与关键词抽取 | 第38-40页 |
4.3 实验分析与总结 | 第40-43页 |
5 在线评论关键词间的语义关联 | 第43-51页 |
5.1 语义关联方式的选择 | 第43-45页 |
5.2 基于LDA和分布式表示的关联 | 第45-48页 |
5.3 实验分析 | 第48-51页 |
结论 | 第51-52页 |
参考文献 | 第52-56页 |
攻读硕士学位期间发表学术论文情况 | 第56-57页 |
致谢 | 第57-59页 |