面向中文微博的关键词提取技术研究

摘要	第4-5页
Abstract	第5-6页
1 绪论	第9-14页
1.1 研究背景及意义	第9-11页
1.2 国内外研究现状	第11-12页
1.3 研究内容	第12页
1.4 结构安排	第12-14页
2 中文微博相关理论及技术概述	第14-28页
2.1 中文微博的基本概念	第14-15页
2.2 中文微博特征分析	第15-17页
2.2.1 中文微博的传播方式	第15-16页
2.2.2 中文微博的文本特征	第16-17页
2.3 关键词提取技术	第17-27页
2.3.1 基于统计学的语言模型	第17-20页
2.3.2 基于语义的语言模型	第20-27页
2.4 本章小结	第27-28页
3 基于隐含主题模型的中文微博关键词提取算法研究	第28-45页
3.1 主题模型的基本思想	第28-29页
3.2 隐含主题模型的简介	第29-35页
3.2.1 隐含主题模型的概率基础	第30-31页
3.2.2 隐含主题贝叶斯网络图	第31-33页
3.2.3 参数估计	第33-35页
3.3 基于隐含主题模型的中文微博关键词提取算法	第35-36页
3.4 中文微博数据的采集	第36-38页
3.5 基于中文微博的词袋模型构建	第38-39页
3.6 实验结果及分析	第39-44页
3.7 本章小结	第44-45页
4 多特征融合主题模型	第45-58页
4.1 主题模型的选取	第45-46页
4.2 语义相似度计算	第46-49页
4.2.1 基于同义词词林的相似度计算	第46-47页
4.2.2 基于HowNet的相似度计算	第47-48页
4.2.3 语义库的选取	第48-49页
4.3 多特征融合概率主题模型	第49-51页
4.3.1 模型的基本思想	第49-50页
4.3.2 多特征融合模型	第50-51页
4.4 实验结果及分析	第51-55页
4.5 演化趋势分析	第55-57页
4.6 本章小结	第57-58页
5 总结与展望	第58-60页
5.1 本文的总结	第58页
5.2 未来的展望	第58-60页
参考文献	第60-64页
攻读硕士学位期间主要成果	第64-65页
致谢	第65-66页