首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于聚类分析的网络论坛舆情信息挖掘技术研究

摘要第1-5页
Abstract第5-10页
第1章 绪论第10-18页
   ·课题来源第10页
   ·研究目的和意义第10-12页
   ·国内外研究现状第12-17页
     ·文本挖掘的应用领域第14-15页
     ·文本挖掘与相关研究工作的关系第15-17页
   ·本文研究内容及组织结构第17-18页
第2章 文本挖掘的技术研究第18-26页
   ·网络舆情的概念第18页
   ·文本挖掘第18-20页
   ·文本聚类第20页
   ·文本表示模型第20-22页
     ·布尔模型第20-21页
     ·向量空间模型第21页
     ·概率检索模型第21-22页
   ·距离的计算方法第22-23页
     ·Pearson距离第22页
     ·Cosine距离第22页
     ·Minkowski距离第22-23页
     ·Kullback-Leibler距离第23页
   ·文本相似度第23-25页
     ·文本之间的相似度第24页
     ·文本簇之间的相似度第24-25页
     ·文本与文本簇之间的相似度第25页
   ·本章小结第25-26页
第3章 文本聚类算法质量评价及分析第26-36页
   ·平面划分聚类法第26-29页
     ·K-Means聚类分析第26-27页
     ·K-Medoids聚类分析第27-28页
     ·最近邻聚类(Nearest Neighbour)第28-29页
   ·基于密度的聚类分析第29-30页
   ·层次聚类法第30-32页
     ·凝聚式层次聚类(HAC第30-31页
     ·分裂式层次聚类第31-32页
   ·聚类算法质量评价标准第32-34页
     ·基于人工判定的指标第33页
     ·基于目标函数的指标第33-34页
   ·实验结果及分析第34-35页
   ·本章小结第35-36页
第4章 BBS舆情信息挖掘系统预处理模块的设计与实现第36-44页
   ·BBS文档的采集第36-39页
     ·BBS站点信息提取第36-38页
     ·BBS文本信息存储第38-39页
   ·BBS文档的结构化处理第39-43页
     ·中文词法分析第39-40页
     ·停用词过滤第40页
     ·特征抽取第40-41页
     ·特征表示第41页
     ·权重计算第41-42页
     ·相似度计算第42-43页
   ·本章小结第43-44页
第5章 BBS舆情信息挖掘系统的设计与实现第44-50页
   ·系统整体流程第44-45页
   ·数据预处理第45页
   ·基于聚类分析的BBS话题挖掘第45-47页
     ·基于聚类分析的话题识别第45-46页
     ·话题识别代价第46页
     ·热度评分第46-47页
   ·实验结果及其分析第47-49页
     ·话题识别实验第48页
     ·话题热度评价实验第48-49页
   ·本章小结第49-50页
结论第50-51页
参考文献第51-56页
攻读硕士学位期间发表的论文及其它成果第56-58页
致谢第58页

论文共58页,点击 下载论文
上一篇:基于SaaS的车辆资源整合与运输服务系统
下一篇:蠕虫检测及其特征自动提取的研究与实现