| 摘要 | 第1-5页 |
| Abstract | 第5-10页 |
| 第1章 引言 | 第10-17页 |
| ·研究的背景 | 第10-11页 |
| ·国内外研究现状 | 第11-14页 |
| ·国外舆情监测研究与管理现状 | 第11-12页 |
| ·国内舆情监测研究与管理现状 | 第12-14页 |
| ·课题研究的目的与意义 | 第14页 |
| ·论文研究的主要内容与贡献 | 第14-15页 |
| ·论文的章节组织 | 第15-17页 |
| 第2章 相关知识介绍 | 第17-24页 |
| ·XML 文档标记语言 | 第17-18页 |
| ·网络爬虫工作原理 | 第18-19页 |
| ·网页去噪工作原理 | 第19-20页 |
| ·倒排索引 | 第20-22页 |
| ·OPEN API 介绍 | 第22-23页 |
| ·本章小结 | 第23-24页 |
| 第3章 系统关键技术研究 | 第24-67页 |
| ·语义模型的解析和处理 | 第24-27页 |
| ·语义模型规范 | 第24-25页 |
| ·语义模型解析技术 | 第25-26页 |
| ·语义模型组合技术 | 第26-27页 |
| ·基于元搜索的网页舆情下载技术 | 第27-42页 |
| ·元搜索的技术特点 | 第28页 |
| ·舆情检索请求技术 | 第28-32页 |
| ·网页舆情检索结果吸取技术 | 第32-39页 |
| ·网页下载技术 | 第39-42页 |
| ·基于 OPEN API 的微博舆情下载技术 | 第42-44页 |
| ·利用 Open API 进行微博舆情下载工作流程 | 第42-43页 |
| ·调用 Open API 服务请求参数配置 | 第43-44页 |
| ·微博检索接口内部工作原理分析 | 第44页 |
| ·基于行块分布算法的网页正文抽取技术 | 第44-51页 |
| ·行块分布算法基本思想 | 第45页 |
| ·行块分布算法实例分析 | 第45-49页 |
| ·利用行块分布进行网页正文抽取 | 第49-51页 |
| ·基于 XML 解析的微博正文抽取技术 | 第51-54页 |
| ·微博舆情原始信息结构 | 第51-54页 |
| ·利用 XML 解析原理进行微博正文抽取 | 第54页 |
| ·基于 LCS 动态规划算法的舆情判重技术 | 第54-58页 |
| ·LCS 问题的结构 | 第55-56页 |
| ·LCS 递归方程的建立 | 第56页 |
| ·利用 LCS 动态规划算法进行舆情判重 | 第56-58页 |
| ·基于词元间距算法的舆情主题判定技术 | 第58-61页 |
| ·词元间距算法基本思想 | 第59页 |
| ·词元间距算法实例分析 | 第59-60页 |
| ·利用词元间距算法进行主题判定 | 第60-61页 |
| ·基于 LUCENE的索引建立技术 | 第61-65页 |
| ·Lucene 的工作原理 | 第61-63页 |
| ·中文分词工具包 IKAnalyzer | 第63页 |
| ·利用 Lucene 和 IKAnalyzer 进行索引建立 | 第63-64页 |
| ·利用 Lucene 和 IKAnalyzer 进行检索 | 第64-65页 |
| ·本章小结 | 第65-67页 |
| 第4章 系统设计与实现 | 第67-94页 |
| ·系统功能模块设计 | 第67-69页 |
| ·系统工作流程 | 第67-68页 |
| ·系统功能结构 | 第68-69页 |
| ·数据库表结构设计 | 第69-75页 |
| ·舆情下载部分实现 | 第75-81页 |
| ·网页舆情下载模块 | 第76-78页 |
| ·微博舆情下载模块 | 第78-81页 |
| ·舆情处理部分实现 | 第81-91页 |
| ·网页正文抽取模块 | 第81-83页 |
| ·微博正文抽取模块 | 第83-85页 |
| ·舆情判重模块 | 第85-87页 |
| ·主题相关判定模块 | 第87-89页 |
| ·索引建立模块 | 第89-91页 |
| ·系统保障机制设计 | 第91-93页 |
| ·中断恢复机制 | 第91-92页 |
| ·数据库防灾备份机制 | 第92页 |
| ·原始数据实时备份机制 | 第92-93页 |
| ·本章小结 | 第93-94页 |
| 第5章 实验结果与分析 | 第94-108页 |
| ·实验环境介绍 | 第94页 |
| ·语义模型解析实验 | 第94-96页 |
| ·舆情下载实验 | 第96-100页 |
| ·网页新闻舆情下载实验 | 第96-98页 |
| ·微博舆情下载实验 | 第98-100页 |
| ·舆情正文抽取实验 | 第100-104页 |
| ·网页舆情正文抽取实验 | 第100-102页 |
| ·微博舆情正文抽取实验 | 第102-104页 |
| ·舆情判重实验 | 第104-105页 |
| ·舆情主题判别实验 | 第105-106页 |
| ·数据综合分析 | 第106-107页 |
| ·本章小结 | 第107-108页 |
| 第6章 总结与展望 | 第108-111页 |
| ·本文总结 | 第108-109页 |
| ·本文展望 | 第109-111页 |
| 参考文献 | 第111-114页 |
| 致谢 | 第114页 |