面向新闻的话题发现和热度评估方法研究

摘要	第4-5页
Abstract	第5-6页
第一章绪论	第9-13页
1.1 研究意义与研究现状	第9-11页
1.1.1 选题背景及研究意义	第9页
1.1.2 国内外研究现状	第9-11页
1.2 本文工作	第11-13页
1.2.1 研究内容	第11-12页
1.2.2 本文组织结构	第12-13页
第二章话题检测的相关技术	第13-21页
2.1 话题检测技术的概述	第13-14页
2.1.1 基本概念	第13-14页
2.1.2 话题发现基本流程	第14页
2.2 文本表示模型	第14-17页
2.2.1 布尔模型	第15页
2.2.2 向量空间模型	第15-16页
2.2.3 概率模型	第16页
2.2.4 语言模型	第16-17页
2.3 相似度计算的方法	第17-18页
2.3.1 文档相似度计算	第17-18页
2.3.2 类簇相似度计算	第18页
2.4 聚类算法介绍	第18-20页
2.4.1 增量聚类算法	第18-19页
2.4.2 基于划分的聚类算法	第19页
2.4.3 基于层次的聚类算法	第19-20页
2.4.4 基于密度的聚类算法	第20页
2.5 本章小结	第20-21页
第三章面向新闻话题发现的方法	第21-32页
3.1 新闻语料的特性分析	第21页
3.2 新闻数据的话题发现模型	第21-25页
3.2.1 基于新闻数据流的预处理	第21-23页
3.2.2 新闻报道及话题的表示模型	第23页
3.2.3 基于新闻数据的词项权重计算	第23-24页
3.2.4 基于新闻数据的文本相似度计算	第24-25页
3.3 基于改进的Single-Pass聚类算法	第25-26页
3.3.1 算法基本思想	第25页
3.3.2 算法流程描述	第25-26页
3.4 实验结果及分析	第26-31页
3.4.1 实验环境及语料	第26-27页
3.4.2 评价指标	第27页
3.4.3 实验结果和分析	第27-31页
3.5 本章小结	第31-32页
第四章话题的热度评估方法研究	第32-37页
4.1 话题热度影响指标	第32页
4.2 话题热度评估方法	第32-33页
4.3 话题热度趋势分析	第33页
4.4 实验结果与分析	第33-36页
4.5 本章小结	第36-37页
第五章总结与展望	第37-38页
5.1 总结	第37页
5.2 展望	第37-38页
参考文献	第38-42页
致谢	第42-43页
在学期间公开发表论文及参加项目情况	第43页