| 摘要 | 第1-5页 |
| ABSTRACT | 第5-9页 |
| 1 绪论 | 第9-13页 |
| ·选题背景及研究意义 | 第9-10页 |
| ·国内外研究现状 | 第10-11页 |
| ·论文研究的主要内容与结构组织 | 第11-13页 |
| ·主要内容 | 第11-12页 |
| ·结构安排 | 第12-13页 |
| 2 相关理论与技术 | 第13-29页 |
| ·Web 信息抽取方法 | 第13-15页 |
| ·文本表示模型 | 第15-19页 |
| ·文本表示 | 第15页 |
| ·特征降维 | 第15-19页 |
| ·文本聚类 | 第19-21页 |
| ·文本分类 | 第21-29页 |
| ·文本分类方法 | 第21-23页 |
| ·支持向量机(SVM)模型构建 | 第23-26页 |
| ·核函数 | 第26-27页 |
| ·文本分类器性能评价 | 第27-29页 |
| 3 微博页面采集与数据预处理 | 第29-43页 |
| ·微博页面采集 | 第29-34页 |
| ·微博 | 第29页 |
| ·主题词选取 | 第29-30页 |
| ·网络爬虫 | 第30-34页 |
| ·数据预处理 | 第34-38页 |
| ·文本规范化处理 | 第34-36页 |
| ·构建 DOM 树 | 第36-38页 |
| ·词法分析 | 第38-43页 |
| ·语料库建设 | 第38-40页 |
| ·中文分词与词性标注 | 第40-43页 |
| 4 微博舆情分析 | 第43-53页 |
| ·微博文本聚类分析 | 第43-46页 |
| ·短文本聚类 | 第43-44页 |
| ·一种基于 K-means 与层次聚类相结合的算法 | 第44-46页 |
| ·情感词提取 | 第46-49页 |
| ·主客观文本分类 | 第46-48页 |
| ·基于条件随机的情感词提取 | 第48-49页 |
| ·文本倾向性分析 | 第49-53页 |
| 5 总结与展望 | 第53-54页 |
| ·全文总结 | 第53页 |
| ·工作展望 | 第53-54页 |
| 致谢 | 第54-55页 |
| 参考文献 | 第55-58页 |
| 附录 | 第58页 |