摘要 | 第1-5页 |
ABSTRACT | 第5-8页 |
第一章 绪论 | 第8-14页 |
·课题背景及意义 | 第8-10页 |
·国内外现状分析 | 第10-12页 |
·课题来源 | 第12-13页 |
·论文内容安排 | 第13-14页 |
第二章 相关理论研究 | 第14-26页 |
·文本分词 | 第14-16页 |
·分词规范 | 第14-15页 |
·歧义词与新词识别 | 第15-16页 |
·文本的表示模型 | 第16-18页 |
·文本的特征提取 | 第18-19页 |
·文本聚类方法 | 第19-24页 |
·划分方法(Partitioning Method) | 第20-21页 |
·层次方法(Hierarchical Method) | 第21-23页 |
·基于密度的方法(Density-Based Clustering Method) | 第23-24页 |
·基于网格的聚类方法(Grid-Based Clustering Method) | 第24页 |
·本章小结 | 第24-26页 |
第三章 舆情信息热点发现的总体设计 | 第26-49页 |
·系统概述 | 第26页 |
·系统需求分析 | 第26-32页 |
·网页信息采集需求 | 第26-28页 |
·信息处理需求 | 第28页 |
·舆情热点需求 | 第28-29页 |
·舆情监控需求 | 第29-32页 |
·系统结构设计 | 第32-45页 |
·网页信息采集模块 | 第32-40页 |
·改进分布式爬虫 | 第33-37页 |
·信息抽取 | 第37-39页 |
·网页去重 | 第39-40页 |
·网页信息预处理模块 | 第40-45页 |
·舆情分析模块 | 第45页 |
·系统流程 | 第45-47页 |
·开发环境介绍 | 第47页 |
·本章小结 | 第47-49页 |
第四章 关键技术研究与实现 | 第49-58页 |
·DAK 算法形成的背景 | 第49-50页 |
·DAK 算法实现过程 | 第50-53页 |
·热点生成 | 第53-56页 |
·文本自动摘要研究 | 第53-55页 |
·热点提取 | 第55-56页 |
·热点展示 | 第56页 |
·本章小结 | 第56-58页 |
第五章 系统性能分析 | 第58-64页 |
·性能测试环境及测试过程 | 第58-59页 |
·测试结果分析 | 第59-63页 |
·本章小结 | 第63-64页 |
第六章 总结与展望 | 第64-66页 |
·总结 | 第64页 |
·展望 | 第64-66页 |
致谢 | 第66-67页 |
参考文献 | 第67-70页 |
硕士期间发表的论文和参与的项目 | 第70-71页 |