首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于语义相关的在线热点话题发现算法的研究与应用

摘要第1-4页
ABSTRACT第4-8页
第一章 绪论第8-15页
   ·研究背景第8-9页
   ·国内外研究现状第9-13页
     ·话题发现技术的研究现状第9-11页
     ·热度评估的研究现状第11页
     ·相关性计算的研究现状第11-12页
     ·问题与挑战第12-13页
   ·论文的主要研究内容第13页
   ·论文组织与结构第13-15页
第二章 相关理论与技术第15-23页
   ·信息采集与预处理第15-18页
     ·网络爬虫工作原理第15-16页
     ·网络爬虫搜索策略第16-17页
     ·基于正则表达式的信息抽取第17-18页
   ·ICTCLAS 分词及词性标方法第18页
   ·文本的向量表示第18-19页
   ·潜在语义模型第19-21页
     ·潜在语义分析第19-20页
     ·概率潜在语义分析 PLSA第20-21页
   ·经典的话题发现聚类算法第21-22页
     ·Single-Pass 算法第21页
     ·基于划分的聚类算法第21-22页
   ·总结第22-23页
第三章 基于概率潜在语义的文本相关度分析第23-31页
   ·相关性定义第23页
   ·相似性与相关性区别第23-24页
   ·概率潜在语义分析第24-27页
     ·文本的语义假设第24-25页
     ·PLSA 的模型假设第25-26页
     ·PLSA 的 EM 算法第26页
     ·基于 PLSA 的相关性定义第26-27页
   ·词汇与文本的相关性计算第27-28页
   ·文本与文本的相关性计算第28-29页
   ·总结第29-31页
第四章 基于语义相关的在线热点话题发现和溯源算法的研究第31-49页
   ·话题自动发现算法第31-33页
     ·话题相关概念定义第31-32页
     ·Single-pass 话题发现算法第32-33页
   ·基于 Single-Pass 算法的改进第33-37页
     ·基于 PLSA 的语义相关性计算第33-34页
     ·阈值的改进第34-35页
     ·改进后的 single-pass 算法第35-37页
   ·热度评估第37-39页
     ·热点话题特征第37-38页
     ·话题关注度第38页
     ·话题热度第38-39页
   ·热点话题溯源和追踪第39-42页
     ·计算话题及事件成员聚焦度及聚焦式的溯源方法第39-40页
     ·微博树方法第40-41页
     ·计算回帖相似度的方法第41-42页
   ·实验及数据分析第42-48页
     ·实验设计第42页
     ·实验环境第42-43页
     ·相关度计算实验第43-45页
     ·改进的 Single-pass 算法第45-48页
   ·总结第48-49页
第五章 在线热点话题发现系统在网络舆情中的应用第49-65页
   ·舆情热点话题发现系统的需求分析第49-50页
   ·在线热点话题发现系统的概要设计第50-51页
   ·话题发现系统的核心模块设计第51-57页
     ·数据采集模块第51-53页
     ·Web 数据预处理模块第53-55页
     ·热点话题发现模块第55-57页
   ·模块实现与系统展示第57-64页
     ·数据采集模块第57-59页
     ·数据预处理模块第59-60页
     ·热点话题发现模块第60-61页
     ·系统展示与分析第61-64页
   ·总结第64-65页
第六章 总结与展望第65-67页
   ·结论第65页
   ·展望第65-67页
致谢第67-68页
参考文献第68-72页
攻读硕士学位期间发表的论文第72-73页

论文共73页,点击 下载论文
上一篇:文本分类算法在高校档案管理中的应用研究
下一篇:基汉中人才网的设计与实现