首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于聚类分析的网络论坛热点话题检测

摘要第1-5页
Abstract第5-10页
第1章 绪论第10-17页
   ·课题研究背景和意义第10-11页
     ·研究背景第10页
     ·研究意义第10-11页
   ·国内外相关研究和综述第11-15页
     ·话题检测与追踪的研究现状第11-13页
     ·网络论坛话题检测的研究现状第13-15页
   ·课题研究内容第15-16页
   ·本文的结构安排第16-17页
第2章 网络论坛话题检测的相关基础知识第17-26页
   ·引言第17页
   ·网络论坛话题检测的基本概念第17-19页
     ·网络论坛第17-18页
     ·话题检测第18-19页
   ·网络论坛文本数据特征分析第19-21页
     ·网络论坛文本数据特性第19-20页
     ·文本表示模型第20页
     ·特征权重的表示方法第20-21页
   ·常用的文本聚类算法第21-25页
     ·层次聚类算法第22-23页
     ·基于划分的聚类方法第23页
     ·增量聚类方法第23-25页
   ·本章小结第25-26页
第3章 面向网络论坛话题检测的文本预处理方法第26-40页
   ·引言第26页
   ·基于文档树的帖子信息抽取算法第26-31页
     ·文档树的定义第27-28页
     ·构建论坛帖子页面文档树第28-29页
     ·信息抽取规则描述第29-30页
     ·信息抽取算法第30-31页
   ·网络论坛短文本特征选择算法第31-35页
     ·基于评估函数的特征筛选算法第31-32页
     ·特征选择算法的比较第32-33页
     ·网络论坛短文本的特性分析第33页
     ·基于TF*PDF的特征选择算法第33-35页
   ·实验与分析第35-39页
     ·实验数据集第35页
     ·信息抽取评价指标第35-36页
     ·信息抽取实验结果及分析第36-37页
     ·文本特征选择结果及分析第37-39页
   ·本章小结第39-40页
第4章 网络论坛热点话题检测第40-56页
   ·引言第40页
   ·网络论坛话题模型的定义第40-41页
   ·基于时间线分析的增量聚类算法第41-46页
     ·算法基本原理第42-43页
     ·算法优化策略第43-44页
     ·算法流程第44-46页
   ·基于话题关注度和用户参与度的话题热度算法第46-49页
     ·网络论坛热点话题的特征第47页
     ·话题关注度计算第47页
     ·用户参与度计算第47-48页
     ·话题热度算法第48-49页
   ·实验与分析第49-55页
     ·实验数据描述第49页
     ·评测标准第49-50页
     ·话题检测结果分析第50-53页
     ·话题热度排序结果分析第53-55页
   ·本章小结第55-56页
第5章 网络论坛热点话题检测系统的设计与实现第56-64页
   ·引言第56页
   ·系统的功能和目标第56-57页
   ·系统总体设计第57页
   ·系统详细设计第57-62页
     ·数据库交互模块第58页
     ·爬虫模块第58-59页
     ·信息抽取模块第59-60页
     ·文本预处理模块第60页
     ·话题检测模块第60-61页
     ·话题热度评分模块第61-62页
   ·系统展示第62-63页
     ·开发平台及工具第62页
     ·可视化功能第62-63页
   ·本章小结第63-64页
结论第64-66页
参考文献第66-71页
攻读硕士学位期间发表的论文第71-73页
致谢第73页

论文共73页,点击 下载论文
上一篇:基于WEB日志挖掘的政府网站可用性研究
下一篇:电子稳像系统中运动估计算法研究