基于语义相关的在线热点话题发现算法的研究与应用

摘要	第1-4页
ABSTRACT	第4-8页
第一章绪论	第8-15页
·研究背景	第8-9页
·国内外研究现状	第9-13页
·话题发现技术的研究现状	第9-11页
·热度评估的研究现状	第11页
·相关性计算的研究现状	第11-12页
·问题与挑战	第12-13页
·论文的主要研究内容	第13页
·论文组织与结构	第13-15页
第二章相关理论与技术	第15-23页
·信息采集与预处理	第15-18页
·网络爬虫工作原理	第15-16页
·网络爬虫搜索策略	第16-17页
·基于正则表达式的信息抽取	第17-18页
·ICTCLAS 分词及词性标方法	第18页
·文本的向量表示	第18-19页
·潜在语义模型	第19-21页
·潜在语义分析	第19-20页
·概率潜在语义分析 PLSA	第20-21页
·经典的话题发现聚类算法	第21-22页
·Single-Pass 算法	第21页
·基于划分的聚类算法	第21-22页
·总结	第22-23页
第三章基于概率潜在语义的文本相关度分析	第23-31页
·相关性定义	第23页
·相似性与相关性区别	第23-24页
·概率潜在语义分析	第24-27页
·文本的语义假设	第24-25页
·PLSA 的模型假设	第25-26页
·PLSA 的 EM 算法	第26页
·基于 PLSA 的相关性定义	第26-27页
·词汇与文本的相关性计算	第27-28页
·文本与文本的相关性计算	第28-29页
·总结	第29-31页
第四章基于语义相关的在线热点话题发现和溯源算法的研究	第31-49页
·话题自动发现算法	第31-33页
·话题相关概念定义	第31-32页
·Single-pass 话题发现算法	第32-33页
·基于 Single-Pass 算法的改进	第33-37页
·基于 PLSA 的语义相关性计算	第33-34页
·阈值的改进	第34-35页
·改进后的 single-pass 算法	第35-37页
·热度评估	第37-39页
·热点话题特征	第37-38页
·话题关注度	第38页
·话题热度	第38-39页
·热点话题溯源和追踪	第39-42页
·计算话题及事件成员聚焦度及聚焦式的溯源方法	第39-40页
·微博树方法	第40-41页
·计算回帖相似度的方法	第41-42页
·实验及数据分析	第42-48页
·实验设计	第42页
·实验环境	第42-43页
·相关度计算实验	第43-45页
·改进的 Single-pass 算法	第45-48页
·总结	第48-49页
第五章在线热点话题发现系统在网络舆情中的应用	第49-65页
·舆情热点话题发现系统的需求分析	第49-50页
·在线热点话题发现系统的概要设计	第50-51页
·话题发现系统的核心模块设计	第51-57页
·数据采集模块	第51-53页
·Web 数据预处理模块	第53-55页
·热点话题发现模块	第55-57页
·模块实现与系统展示	第57-64页
·数据采集模块	第57-59页
·数据预处理模块	第59-60页
·热点话题发现模块	第60-61页
·系统展示与分析	第61-64页
·总结	第64-65页
第六章总结与展望	第65-67页
·结论	第65页
·展望	第65-67页
致谢	第67-68页
参考文献	第68-72页
攻读硕士学位期间发表的论文	第72-73页