| 摘要 | 第1-6页 |
| Abstract | 第6-9页 |
| 第一章 绪论 | 第9-19页 |
| ·研究背景及意义 | 第9-11页 |
| ·网络信息资源概述 | 第9-10页 |
| ·互联网热点信息主题自动发现的研究意义 | 第10-11页 |
| ·国内外相关研究及分析 | 第11-16页 |
| ·热点信息主题自动发现研究现状与分析 | 第12-14页 |
| ·文本聚类技术研究现状与分析 | 第14-16页 |
| ·论文的主要工作及创新点 | 第16-17页 |
| ·论文的组织结构 | 第17-19页 |
| 第二章 互联网文本预处理技术与相关改进 | 第19-31页 |
| ·网页信息抽取技术 | 第19页 |
| ·文本分词技术 | 第19-20页 |
| ·文本特征提取方法与改进 | 第20-27页 |
| ·文本特征权值计算方法的改进 | 第20-22页 |
| ·文本概念特征抽取与表示 | 第22-27页 |
| ·文本表示模型与改进 | 第27-28页 |
| ·文本特征向量表示 | 第27-28页 |
| ·基于新闻事件特性的文本向量表示 | 第28页 |
| ·文本相似度计算方法 | 第28-30页 |
| ·本章小结 | 第30-31页 |
| 第三章 文本聚类相关技术分析与改进 | 第31-41页 |
| ·聚类过程描述 | 第31页 |
| ·文本聚类算法的对比与分析 | 第31-37页 |
| ·文本聚类算法的对比 | 第31-34页 |
| ·基于密度的聚类算法分析 | 第34-37页 |
| ·文本聚类结果描述算法与改进 | 第37-40页 |
| ·聚类结果描述算法 | 第38页 |
| ·基于 FP-growth 算法的 DCF 类簇标签生成算法 | 第38-40页 |
| ·本章小结 | 第40-41页 |
| 第四章 热点信息主题自动发现技术与评估方法研究 | 第41-58页 |
| ·热点信息主题自动发现实现流程框架 | 第41-42页 |
| ·基于密度的聚类算法的改进方向 | 第42-43页 |
| ·基于 SRB-MRClustering 文本聚类的热点信息主题自动发现算法 | 第43-50页 |
| ·文本表示过程描述 | 第43-44页 |
| ·SRB-MRClustering 算法中的相关定义 | 第44-45页 |
| ·SRB-MRClustering 算法描述 | 第45-48页 |
| ·子簇邻接信息的描述 | 第48-49页 |
| ·子簇模糊合并聚类 | 第49-50页 |
| ·SRB-MRClustering 算法实验分析 | 第50-54页 |
| ·算法性能评估 | 第51-52页 |
| ·聚类效果分析 | 第52-54页 |
| ·网络热点信息主题评估方法 | 第54-57页 |
| ·网络热点信息主题的特征分析 | 第55-56页 |
| ·热度评估量化方法 | 第56-57页 |
| ·本章小结 | 第57-58页 |
| 第五章 互联网海量信息中热点信息主题自动发现实验及结果分析 | 第58-67页 |
| ·实验语料数据集 | 第58-59页 |
| ·实验步骤 | 第59-60页 |
| ·实验结果分析与检验评估 | 第60-67页 |
| 总结与展望 | 第67-68页 |
| 参考文献 | 第68-74页 |
| 攻读硕士学位期间取得的研究成果 | 第74-75页 |
| 致谢 | 第75-76页 |
| 附件 | 第76页 |