中文微博观点摘要自动抽取研究

摘要	第2-3页
Abstract	第3页
1 绪论	第6-12页
1.1 研究背景与意义	第6-7页
1.2 研究现状与分析	第7-9页
1.3 研究难点	第9-10页
1.3.1 微博摘要和传统文档摘要的差异	第9页
1.3.2 标注语料的匮乏	第9-10页
1.4 本文的主要工作	第10页
1.5 本文的组织结构	第10-12页
2 理论背景与相关模型	第12-20页
2.1 微博观点摘要	第12页
2.1.1 基本概念	第12页
2.1.2 任务描述	第12页
2.2 基于TF-IDF的关键词抽取	第12-13页
2.3 语言模型	第13-15页
2.3.1 基于统计的语言模型	第13-14页
2.3.2 神经网络语言模型	第14-15页
2.4 词向量模型	第15-20页
2.4.1 独热(One-hot)表示法	第15-16页
2.4.2 分布式表示法	第16-20页
3 基于重要程度和冗余程度的观点摘要抽取	第20-36页
3.1 数据预处理	第20-22页
3.2 基于情感词典的观点性微博识别	第22-24页
3.3 微博重要性分数的计算	第24-26页
3.3.1 微博话题关键词抽取	第24-25页
3.3.2 微博重要性分数的计算	第25-26页
3.4 基于词向量的微博向量化表示及相似度计算	第26-28页
3.5 微博观点摘要的生成	第28-30页
3.6 实验与分析	第30-36页
3.6.1 实验数据	第30-32页
3.6.2 评价方法	第32-33页
3.6.3 实验结果及其分析	第33-36页
4 基于语义图优化算法的观点摘要抽取	第36-46页
4.1 模型构建	第36-37页
4.2 模型求解	第37-40页
4.3 实验结果与分析	第40-46页
结论	第46-47页
参考文献	第47-50页
攻读硕士学位期间发表学术论文情况	第50-51页
致谢	第51-53页