网络热点新闻事件挖掘和跟踪分析方法的研究与实现
摘要 | 第1-4页 |
ABSTRACT | 第4-7页 |
第一章 引言 | 第7-13页 |
·研究背景 | 第7-9页 |
·热点新闻分析的出现及意义 | 第7-8页 |
·热点新闻挖掘的主要内容 | 第8-9页 |
·研究现状 | 第9-11页 |
·本文的主要工作 | 第11-13页 |
第二章 网页分析相关技术 | 第13-21页 |
·网页信息获取技术 | 第13-14页 |
·文本处理技术 | 第14-17页 |
·数据挖掘相关技术 | 第17-19页 |
·文本分类 | 第17-18页 |
·文本聚类 | 第18-19页 |
·数据可视化 | 第19页 |
·本章小结 | 第19-21页 |
第三章 问题描述及系统框架 | 第21-27页 |
·问题描述及概念定义 | 第21-22页 |
·热点新闻挖掘技术 | 第22-23页 |
·系统框架设计 | 第23-26页 |
·本章小结 | 第26-27页 |
第四章 新闻信息的获取及预处理 | 第27-34页 |
·新闻信息的获取 | 第27-29页 |
·网页获取的特点 | 第27-28页 |
·网页获取的实现 | 第28-29页 |
·新闻信息提取 | 第29-33页 |
·网页的解析 | 第29-30页 |
·网页正文的提取 | 第30-32页 |
·分词及建立索引 | 第32-33页 |
·新闻信息的存储 | 第33页 |
·本章小结 | 第33-34页 |
第五章 新闻信息的挖掘和分析 | 第34-48页 |
·新闻信息的分类 | 第34-39页 |
·KNN方法的分析与实现 | 第34-37页 |
·分类结果评测 | 第37-39页 |
·新闻信息的聚类分析 | 第39-43页 |
·K-Medoid聚类算法 | 第39-41页 |
·算法效率优化 | 第41-42页 |
·聚类标签生成 | 第42页 |
·聚类效果分析 | 第42-43页 |
·新闻信息分析的可视化 | 第43-44页 |
·系统效果分析和总结 | 第44-47页 |
·本章小结 | 第47-48页 |
第六章 总结及未来工作 | 第48-51页 |
参考文献 | 第51-55页 |
致谢 | 第55页 |