首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

BBS热点话题发现与监控系统

致谢第1-6页
中文摘要第6-7页
ABSTRACT第7-11页
1 绪论第11-16页
   ·研究背景和意义第11-12页
     ·课题研究的背景第11-12页
     ·课题研究的意义第12页
   ·国内外研究现状第12-13页
   ·论文的主要工作及组织结构第13-16页
2 相关技术介绍第16-33页
   ·Web文本挖掘技术第16-21页
     ·Web文本挖掘过程第16-17页
     ·文本挖掘关键技术第17-21页
   ·网络数据采集技术介绍第21-28页
     ·网络爬虫技术第21-25页
     ·页面信息抽取技术第25-26页
     ·URL语法解析及分类算法第26-28页
   ·热点话题发现技术第28-31页
     ·话题检测与跟踪相关概念第28-29页
     ·热点话题发现相关算法第29-31页
   ·系统开发工具介绍第31-32页
     ·HtmlParse介绍第31页
     ·正则表达式第31-32页
     ·ICTCLAS汉语分词系统第32页
   ·本章小结第32-33页
3 BBS热点话题发现与监控系统设计第33-38页
   ·系统总体设计第33-34页
     ·系统功能介绍第33页
     ·系统总体设计第33-34页
   ·系统模块划分第34-37页
     ·信息采集模块第34-35页
     ·数据预处理模块第35-36页
     ·热点话题发现模块第36页
     ·热点话题监控模块第36-37页
   ·本章小结第37-38页
4 BBS数据采集及预处理的实现第38-55页
   ·BBS数据爬取第38-41页
     ·BBS逻辑结构分析第38-39页
     ·BBS信息采集策略第39-40页
     ·版面链接URL的识别第40-41页
     ·重复链接的处理第41页
   ·BBS信息预处理第41-50页
     ·常见论坛帖子元素分析第41-43页
     ·获取数据分类及数据库表的设计第43-47页
     ·基于模板的网页信息抽取第47-49页
     ·中文词法分析第49页
     ·停用词的过滤第49-50页
   ·实验结果及分析第50-54页
   ·本章小结第54-55页
5 BBS热点话题发现与监控的实现第55-69页
   ·热点话题发现第55-64页
     ·BBS文本表示第55-56页
     ·相似度计算第56-57页
     ·基于Single-Pass改进算法的话题识别第57-58页
     ·聚类结果实现及分析第58-62页
     ·热度评估第62-64页
   ·热点话题监控第64-68页
     ·话题监控算法分析第64-65页
     ·INN增量分类算法第65-66页
     ·实验及结果分析第66-68页
   ·本章小结第68-69页
6 结论与展望第69-71页
   ·结论第69页
   ·展望第69-71页
参考文献第71-73页
作者简历第73-75页
学位论文数据集第75页

论文共75页,点击 下载论文
上一篇:明清时期驱蝗神祈禳研究
下一篇:应用协议的规则提取及优化策略