摘要 | 第1-5页 |
ABSTRACT | 第5-9页 |
1 绪论 | 第9-13页 |
·选题背景及研究意义 | 第9-10页 |
·国内外研究现状 | 第10-11页 |
·论文研究的主要内容与结构组织 | 第11-13页 |
·主要内容 | 第11-12页 |
·结构安排 | 第12-13页 |
2 相关理论与技术 | 第13-29页 |
·Web 信息抽取方法 | 第13-15页 |
·文本表示模型 | 第15-19页 |
·文本表示 | 第15页 |
·特征降维 | 第15-19页 |
·文本聚类 | 第19-21页 |
·文本分类 | 第21-29页 |
·文本分类方法 | 第21-23页 |
·支持向量机(SVM)模型构建 | 第23-26页 |
·核函数 | 第26-27页 |
·文本分类器性能评价 | 第27-29页 |
3 微博页面采集与数据预处理 | 第29-43页 |
·微博页面采集 | 第29-34页 |
·微博 | 第29页 |
·主题词选取 | 第29-30页 |
·网络爬虫 | 第30-34页 |
·数据预处理 | 第34-38页 |
·文本规范化处理 | 第34-36页 |
·构建 DOM 树 | 第36-38页 |
·词法分析 | 第38-43页 |
·语料库建设 | 第38-40页 |
·中文分词与词性标注 | 第40-43页 |
4 微博舆情分析 | 第43-53页 |
·微博文本聚类分析 | 第43-46页 |
·短文本聚类 | 第43-44页 |
·一种基于 K-means 与层次聚类相结合的算法 | 第44-46页 |
·情感词提取 | 第46-49页 |
·主客观文本分类 | 第46-48页 |
·基于条件随机的情感词提取 | 第48-49页 |
·文本倾向性分析 | 第49-53页 |
5 总结与展望 | 第53-54页 |
·全文总结 | 第53页 |
·工作展望 | 第53-54页 |
致谢 | 第54-55页 |
参考文献 | 第55-58页 |
附录 | 第58页 |