互联网舆情信息挖掘技术研究与实现

摘要	第5-6页
ABSTRACT	第6-7页
第一章绪论	第11-15页
1.1 研究背景及意义	第11-12页
1.1.1 背景	第11页
1.1.2 意义	第11-12页
1.2 国内外互联网舆情信息研究现状	第12-13页
1.2.1 国内研究现状	第12页
1.2.2 国外研究现状	第12-13页
1.3 本文主要研究内容	第13页
1.4 本文的组织和结构	第13-15页
第二章网络舆情信息挖掘	第15-22页
2.1 网络信息采集基础介绍	第15页
2.2 互联网舆情信息的获取	第15-16页
2.3 热点舆情话题判断	第16-18页
2.4 文本分类技术	第18-19页
2.5 语义分析技术	第19-20页
2.6 文本的情感倾向性分析	第20页
2.7 小结	第20-22页
第三章文本分类	第22-35页
3.1 文本分类技术研究现状	第22页
3.2 文本分类相关技术	第22-33页
3.2.1 文本分词	第22-29页
3.2.2 文本表示	第29页
3.2.3 特征词选择	第29-31页
3.2.4 文本分类算法	第31-33页
3.3 分类算法评价策略	第33-34页
3.3.1 召回率和准确率	第33-34页
3.4 本章小结	第34-35页
第四章网络爬虫与锚文本应用	第35-48页
4.1 网络爬虫应用背景	第35页
4.2 爬虫的搜索策略	第35-36页
4.3 网络爬虫的研究	第36-39页
4.3.1 通用爬虫技术	第37-38页
4.3.2 主题爬虫技术	第38-39页
4.4 基于锚文本的爬虫概要设计	第39-42页
4.4.1 高性能网络爬虫分析	第40页
4.4.2 基于锚文本的网络爬虫	第40-42页
4.5 锚文本应用分析	第42-46页
4.5.1 锚文本与热点关键词	第42页
4.5.2 锚文本分词	第42-45页
4.5.3 锚文本与关键词匹配	第45-46页
4.6 本章小结	第46-48页
第五章基于锚文本网络爬虫系统实现和测试	第48-66页
5.1 下载模块	第48-53页
5.2 网页分析模块	第53-55页
5.2.1 页面内容提取	第53-54页
5.2.2 URL 解析	第54-55页
5.3 网页内容去重模块	第55-58页
5.4 锚文本匹配模块	第58-60页
5.4.1 匹配流程	第58-59页
5.4.2 关键词存储	第59-60页
5.5 URL 分配模块	第60-61页
5.6 系统测试结果与分析	第61-64页
5.6.1 热点选词及分词结果	第62-63页
5.6.2 实验结果	第63-64页
5.6.3 结论	第64页
5.7 本章小结	第64-66页
第六章总结与展望	第66-67页
参考文献	第67-69页
攻读硕士学位期间取得的研究成果	第69-70页
致谢	第70-71页
附件	第71页