首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于语义的Web文本聚类方法研究

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-13页
   ·研究背景及意义第10页
   ·国内外研究现状第10-11页
     ·国外研究现状第11页
     ·国内研究现状第11页
   ·论文研究内容第11-12页
   ·论文组织及结构第12-13页
第2章 文本表示模型及其关键技术第13-22页
   ·文本的中文分词第13-15页
     ·基于词表的分词方法第13-14页
     ·基于统计的分词方法第14-15页
   ·文本的特征选择第15-18页
     ·文档频数第16页
     ·信息增益第16页
     ·互信息第16-17页
     ·卡方统计第17页
     ·交叉熵第17页
     ·证据权值第17-18页
   ·文本的特征表示第18-21页
     ·空间向量模型基本概念第18-19页
     ·特征单元选择第19-20页
     ·项的权重计算第20-21页
   ·本章小结第21-22页
第3章 文本聚类分析第22-30页
   ·聚类分析概述第22-23页
   ·常用聚类算法第23-27页
     ·基于层次的方法第23-24页
     ·基于划分的方法第24-25页
     ·基于模型的方法第25页
     ·基于密度的方法第25-26页
     ·基于网格的方法第26-27页
     ·软聚类的方法第27页
   ·聚类效果评价第27-29页
     ·统计度量第27-28页
     ·纯度度量第28-29页
   ·本章小结第29-30页
第4章 知网与语义相似度计算第30-42页
   ·知网第30-34页
     ·知网的基本结构第30-32页
     ·知网概念组织规则第32-34页
   ·基于知网的义原与概念相似度第34-40页
     ·义原距离算法第34-37页
     ·义原相似度与概念相似度第37-39页
     ·概念相似度分析第39-40页
   ·基于知网的改进 VSM第40-41页
   ·本章小结第41-42页
第5章 微博话题发现系统的设计与实现第42-54页
   ·系统介绍与框架第42-43页
   ·数据收集模块第43-44页
   ·中文分词模块第44-45页
   ·特征表示模块第45-47页
   ·文本聚类模块第47-48页
   ·系统实验与测试第48-53页
     ·实验环境与数据集第48-49页
     ·实验结果与分析第49-53页
   ·本章小结第53-54页
第6章 总结与展望第54-56页
   ·本文工作总结第54页
   ·未来工作展望第54-56页
致谢第56-57页
参考文献第57-59页
附录第59页

论文共59页,点击 下载论文
上一篇:基于小波变换的图像融合算法的研究
下一篇:灰色AHP及TOPSIS方法在管理信息系统中的应用研究