高校校园网论坛热点话题发现系统的研究与实现

摘要	第1-6页
Abstract	第6-7页
第1章前言	第7-11页
·论文背景及研究意义	第7-8页
·国内外研究现状	第8-9页
·本文研究的内容	第9-10页
·论文的组织结构	第10-11页
第2章 TDT研究简介	第11-18页
·TDT研究的历史与发展	第11-13页
·TDT的研究内容及任务	第13-16页
·TDT研究中的基本概念	第13-14页
·TDT的研究内容及任务	第14-16页
·报道切分	第15页
·话题跟踪	第15页
·话题检测	第15页
·首次报道检测任务	第15-16页
·关联检测任务	第16页
·新任务的提出	第16页
·TDT研究的主要实现方法	第16-18页
第3章高校校园网论坛的作用	第18-24页
·网络论坛历史	第18-19页
·高校网络论坛在大学生思想政治教育中的作用	第19-21页
·话题检测在高校校园网网络论坛中的应用	第21-24页
第4章高校网络论坛热点话题检测方法	第24-43页
·文本的聚类	第24-32页
·文本的聚类方法	第24-31页
·文本聚类的策略划分	第24-25页
·文本聚类的方式划分	第25-29页
·文本聚类的其他划分	第29-31页
·本文使用的聚类方法	第31-32页
·数据文档的表示模型	第32-37页
·向量空间VSM表示模型	第32-36页
·向量空间表示模型的基本思想	第32-33页
·文本特征项选择	第33-34页
·特征项的权重计算	第34-36页
·语言表示模型	第36-37页
·布尔模型	第37页
·相似度的计算	第37-38页
·数据文档预处理	第38-39页
·分词	第38页
·去除停用词	第38-39页
·BBS数据采集	第39-40页
·BBS数据表结构	第39页
·BBS论坛数据采集	第39-40页
·聚类后的处理	第40-42页
·标记灌水帖	第40-41页
·特征词提取的热点话题识别	第41-42页
·热度排序	第41-42页
·基于特征词的热点话题识别	第42页
·话题发现步骤	第42-43页
第5章系统设计与实现	第43-51页
·系统的总体框架	第43-46页
·系统部分主要算法代码	第46-50页
·一个简单的网络爬虫代码	第46-47页
·调用ICTCLAS时的接口	第47页
·KNN聚类算法主要代码	第47-50页
·系统的主要界面	第50-51页
第6章总结	第51-52页
·本文总结	第51页
·进一步的工作	第51-52页
致谢	第52-53页
参考文献	第53-56页