基于中文微博的自动文摘研究

中文摘要	第4-6页
ABSTRACT	第6-8页
第1章绪论	第11-17页
1.1 研究背景及意义	第11-12页
1.2 国内外研究现状	第12-15页
1.2.1 微博的研究现状	第12-13页
1.2.2 LDA主题模型的自动文摘研究	第13-14页
1.2.3 微博的自动文摘研究	第14-15页
1.3 本文主要工作	第15-16页
1.4 本文组织结构	第16-17页
第2章中文微博自动文摘的相关工作	第17-21页
2.1 自动文摘	第17-19页
2.1.1 自动文摘的分类	第17页
2.1.2 自动文摘的一般过程	第17-18页
2.1.3 自动文摘评价	第18-19页
2.2 微博的文本特性	第19-20页
2.3 本章小结	第20-21页
第3章微博数据的获取及预处理	第21-26页
3.1 实验语料的获取	第22-23页
3.2 语料的文本提取	第23页
3.3 中文分词	第23-24页
3.4 去停用词	第24-25页
3.5 本章小结	第25-26页
第4章基于中文微博自动文摘的方法研究	第26-38页
4.1 中文微博文摘生成过程	第26页
4.2 基于向量空间模型的微博自动文摘方法	第26-29页
4.2.1 基于空间向量模型的TF-IDF	第27-28页
4.2.2 改进的空间向量模型方法	第28-29页
4.3 基于LDA模型的微博自动文摘方法	第29-37页
4.3.1 基于LDA模型的微博分类	第30-31页
4.3.2 LDA主题模型参数推导	第31-37页
4.4 本章小结	第37-38页
第5章微博文摘句的抽取及评价	第38-44页
5.1 语句的抽取	第38-40页
5.2 语句的压缩	第40页
5.3 实验结果与分析	第40-43页
5.4 本章小结	第43-44页
第6章总结与展望	第44-46页
6.1 本文的工作总结	第44-45页
6.2 未来展望	第45-46页
参考文献	第46-49页
致谢	第49-51页
攻读学位期间发表的论文	第51页