基于Web文本信息抽取的微博舆情分析

摘要	第1-5页
ABSTRACT	第5-9页
1 绪论	第9-13页
·选题背景及研究意义	第9-10页
·国内外研究现状	第10-11页
·论文研究的主要内容与结构组织	第11-13页
·主要内容	第11-12页
·结构安排	第12-13页
2 相关理论与技术	第13-29页
·Web 信息抽取方法	第13-15页
·文本表示模型	第15-19页
·文本表示	第15页
·特征降维	第15-19页
·文本聚类	第19-21页
·文本分类	第21-29页
·文本分类方法	第21-23页
·支持向量机（SVM）模型构建	第23-26页
·核函数	第26-27页
·文本分类器性能评价	第27-29页
3 微博页面采集与数据预处理	第29-43页
·微博页面采集	第29-34页
·微博	第29页
·主题词选取	第29-30页
·网络爬虫	第30-34页
·数据预处理	第34-38页
·文本规范化处理	第34-36页
·构建 DOM 树	第36-38页
·词法分析	第38-43页
·语料库建设	第38-40页
·中文分词与词性标注	第40-43页
4 微博舆情分析	第43-53页
·微博文本聚类分析	第43-46页
·短文本聚类	第43-44页
·一种基于 K-means 与层次聚类相结合的算法	第44-46页
·情感词提取	第46-49页
·主客观文本分类	第46-48页
·基于条件随机的情感词提取	第48-49页
·文本倾向性分析	第49-53页
5 总结与展望	第53-54页
·全文总结	第53页
·工作展望	第53-54页
致谢	第54-55页
参考文献	第55-58页
附录	第58页