网络热点新闻事件挖掘和跟踪分析方法的研究与实现
| 摘要 | 第1-4页 |
| ABSTRACT | 第4-7页 |
| 第一章 引言 | 第7-13页 |
| ·研究背景 | 第7-9页 |
| ·热点新闻分析的出现及意义 | 第7-8页 |
| ·热点新闻挖掘的主要内容 | 第8-9页 |
| ·研究现状 | 第9-11页 |
| ·本文的主要工作 | 第11-13页 |
| 第二章 网页分析相关技术 | 第13-21页 |
| ·网页信息获取技术 | 第13-14页 |
| ·文本处理技术 | 第14-17页 |
| ·数据挖掘相关技术 | 第17-19页 |
| ·文本分类 | 第17-18页 |
| ·文本聚类 | 第18-19页 |
| ·数据可视化 | 第19页 |
| ·本章小结 | 第19-21页 |
| 第三章 问题描述及系统框架 | 第21-27页 |
| ·问题描述及概念定义 | 第21-22页 |
| ·热点新闻挖掘技术 | 第22-23页 |
| ·系统框架设计 | 第23-26页 |
| ·本章小结 | 第26-27页 |
| 第四章 新闻信息的获取及预处理 | 第27-34页 |
| ·新闻信息的获取 | 第27-29页 |
| ·网页获取的特点 | 第27-28页 |
| ·网页获取的实现 | 第28-29页 |
| ·新闻信息提取 | 第29-33页 |
| ·网页的解析 | 第29-30页 |
| ·网页正文的提取 | 第30-32页 |
| ·分词及建立索引 | 第32-33页 |
| ·新闻信息的存储 | 第33页 |
| ·本章小结 | 第33-34页 |
| 第五章 新闻信息的挖掘和分析 | 第34-48页 |
| ·新闻信息的分类 | 第34-39页 |
| ·KNN方法的分析与实现 | 第34-37页 |
| ·分类结果评测 | 第37-39页 |
| ·新闻信息的聚类分析 | 第39-43页 |
| ·K-Medoid聚类算法 | 第39-41页 |
| ·算法效率优化 | 第41-42页 |
| ·聚类标签生成 | 第42页 |
| ·聚类效果分析 | 第42-43页 |
| ·新闻信息分析的可视化 | 第43-44页 |
| ·系统效果分析和总结 | 第44-47页 |
| ·本章小结 | 第47-48页 |
| 第六章 总结及未来工作 | 第48-51页 |
| 参考文献 | 第51-55页 |
| 致谢 | 第55页 |