摘要 | 第4-5页 |
ABSTRACT | 第5-6页 |
第一章 绪论 | 第9-18页 |
1.1 研究背景及意义 | 第9-11页 |
1.2 相关工作 | 第11-16页 |
1.2.1 文献引用研究现状 | 第11-12页 |
1.2.2 意见挖掘研究现状 | 第12-13页 |
1.2.3 词嵌入模型研究现状 | 第13-15页 |
1.2.4 国外内容关联研究现状 | 第15-16页 |
1.3 本论文研究工作 | 第16-17页 |
1.4 论文结构安排 | 第17-18页 |
第二章 词嵌入模型相关研究 | 第18-28页 |
2.1 词表示模型 | 第18-19页 |
2.1.1 One-hot Representation | 第18页 |
2.1.2 Distributed representation | 第18-19页 |
2.2 词嵌入模型介绍 | 第19-27页 |
2.2.1 ngram | 第19页 |
2.2.2 NNLM | 第19-21页 |
2.2.3 Log-Linear模型 | 第21-22页 |
2.2.4 Log-Bilinear模型 | 第22-23页 |
2.2.5 层次化Log-Bilinear模型 | 第23页 |
2.2.6 CBOW模型 | 第23-26页 |
2.2.7 GloVe模型 | 第26-27页 |
2.3 本章小结 | 第27-28页 |
第三章 词嵌入模型的训练与评估 | 第28-41页 |
3.1 训练数据介绍 | 第28-30页 |
3.1.1 英文语料 | 第28-30页 |
3.1.2 中文语料 | 第30页 |
3.2 模型系统搭建 | 第30-31页 |
3.2.1 CBOW模型搭建使用过程 | 第30-31页 |
3.2.2 GloVe模型搭建使用过程 | 第31页 |
3.3 词向量评估 | 第31-39页 |
3.3.1 余弦距离 | 第32页 |
3.3.2 WordSim353与皮尔逊相关系数评估 | 第32-35页 |
3.3.3 词类比评估 | 第35-39页 |
3.4 本章小结 | 第39-41页 |
第四章 论文文献上的内容关联方法设计与应用 | 第41-50页 |
4.1 测试语料介绍 | 第41-42页 |
4.1.1 TAC2014—生物论文文献 | 第41-42页 |
4.2 内容关联方法 | 第42-45页 |
4.2.1 传统方法 | 第42-45页 |
4.2.2 词嵌入方法 | 第45页 |
4.3 关联效果评价 | 第45页 |
4.4 实验结果 | 第45-49页 |
4.5 本章小结 | 第49-50页 |
第五章 社交网络中的内容关联方法设计与应用 | 第50-66页 |
5.1 测试语料介绍 | 第50-54页 |
5.1.1 天涯中文论坛 | 第50-53页 |
5.1.2 OnForumS2015—英国卫报 | 第53-54页 |
5.2 内容关联方法 | 第54-61页 |
5.2.1 基于引证思想的关联抽取 | 第55-56页 |
5.2.2 余弦相似度与共现和分布相似性 | 第56-57页 |
5.2.3 向量空间模型与LDA | 第57-58页 |
5.2.4 基于词嵌入特征 | 第58-61页 |
5.3 关联效果评价 | 第61-62页 |
5.3.1 天涯中文论坛 | 第61页 |
5.3.2 英国卫报在线网站 | 第61-62页 |
5.4 实验结果 | 第62-65页 |
5.4.1 天涯中文论坛 | 第62-64页 |
5.4.2 英国卫报在线网站 | 第64-65页 |
5.5 本章小结 | 第65-66页 |
第六章 总结与展望 | 第66-67页 |
参考文献 | 第67-70页 |
致谢 | 第70-71页 |
攻读硕士学位期间发表的学术论文 | 第71页 |