摘要 | 第1-6页 |
Abstract | 第6-9页 |
第一章 绪论 | 第9-19页 |
·研究背景及意义 | 第9-11页 |
·网络信息资源概述 | 第9-10页 |
·互联网热点信息主题自动发现的研究意义 | 第10-11页 |
·国内外相关研究及分析 | 第11-16页 |
·热点信息主题自动发现研究现状与分析 | 第12-14页 |
·文本聚类技术研究现状与分析 | 第14-16页 |
·论文的主要工作及创新点 | 第16-17页 |
·论文的组织结构 | 第17-19页 |
第二章 互联网文本预处理技术与相关改进 | 第19-31页 |
·网页信息抽取技术 | 第19页 |
·文本分词技术 | 第19-20页 |
·文本特征提取方法与改进 | 第20-27页 |
·文本特征权值计算方法的改进 | 第20-22页 |
·文本概念特征抽取与表示 | 第22-27页 |
·文本表示模型与改进 | 第27-28页 |
·文本特征向量表示 | 第27-28页 |
·基于新闻事件特性的文本向量表示 | 第28页 |
·文本相似度计算方法 | 第28-30页 |
·本章小结 | 第30-31页 |
第三章 文本聚类相关技术分析与改进 | 第31-41页 |
·聚类过程描述 | 第31页 |
·文本聚类算法的对比与分析 | 第31-37页 |
·文本聚类算法的对比 | 第31-34页 |
·基于密度的聚类算法分析 | 第34-37页 |
·文本聚类结果描述算法与改进 | 第37-40页 |
·聚类结果描述算法 | 第38页 |
·基于 FP-growth 算法的 DCF 类簇标签生成算法 | 第38-40页 |
·本章小结 | 第40-41页 |
第四章 热点信息主题自动发现技术与评估方法研究 | 第41-58页 |
·热点信息主题自动发现实现流程框架 | 第41-42页 |
·基于密度的聚类算法的改进方向 | 第42-43页 |
·基于 SRB-MRClustering 文本聚类的热点信息主题自动发现算法 | 第43-50页 |
·文本表示过程描述 | 第43-44页 |
·SRB-MRClustering 算法中的相关定义 | 第44-45页 |
·SRB-MRClustering 算法描述 | 第45-48页 |
·子簇邻接信息的描述 | 第48-49页 |
·子簇模糊合并聚类 | 第49-50页 |
·SRB-MRClustering 算法实验分析 | 第50-54页 |
·算法性能评估 | 第51-52页 |
·聚类效果分析 | 第52-54页 |
·网络热点信息主题评估方法 | 第54-57页 |
·网络热点信息主题的特征分析 | 第55-56页 |
·热度评估量化方法 | 第56-57页 |
·本章小结 | 第57-58页 |
第五章 互联网海量信息中热点信息主题自动发现实验及结果分析 | 第58-67页 |
·实验语料数据集 | 第58-59页 |
·实验步骤 | 第59-60页 |
·实验结果分析与检验评估 | 第60-67页 |
总结与展望 | 第67-68页 |
参考文献 | 第68-74页 |
攻读硕士学位期间取得的研究成果 | 第74-75页 |
致谢 | 第75-76页 |
附件 | 第76页 |