首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于电阻距离的中文文本谱聚类算法研究

摘要第1-6页
Abstract第6-11页
第一章 绪论第11-17页
   ·研究背景及意义第11-12页
   ·文本聚类研究现状第12-14页
   ·文本聚类的难点第14-15页
   ·本文的研究内容第15-16页
   ·本文内容的组织结构第16-17页
第二章 中文文本聚类的关键技术第17-35页
   ·中文文本聚类概述第17-18页
   ·文本预处理第18-21页
     ·中文分词第18-19页
     ·去停用词第19-20页
     ·ICTCLAS 分词库第20-21页
   ·文本表示模型第21-24页
     ·布尔模型第21页
     ·向量空间模型第21-23页
     ·概率模型第23页
     ·语言模型第23-24页
   ·文本特征选择第24-27页
     ·基于阀值的特征选择方法第24-27页
     ·基于映射的特征选择方法第27页
   ·文本相似度计算第27-29页
     ·欧式距离(Euclidean Distance)第28页
     ·余弦相似度(Cosine Similarity)第28-29页
     ·杰卡德系数(Jaccard Cofficient)第29页
     ·皮尔森相关系数(Pearson Correlation Coefficient)第29页
   ·文本聚类算法第29-34页
     ·基于层次的聚类第29-31页
     ·基于划分的聚类第31-34页
   ·本章小结第34-35页
第三章 一种基于电阻距离的中文文本谱聚类算法第35-47页
   ·图的电阻距离定义第35-36页
   ·图的电阻距离计算方法第36-37页
   ·文本的二分图表示模型第37-38页
   ·基于电阻距离相似度的文本二分图第38-41页
     ·电阻距离相似度第38-40页
     ·基于电阻距离的文本二分图表示模型第40-41页
   ·基于电阻距离的中文文本谱聚类算法第41-43页
     ·文本的二分图谱聚类算法第41页
     ·基于电阻距离的中文文本谱聚类算法第41-43页
   ·聚类效果的评价标准第43-46页
     ·基于目标函数的指标第43-44页
     ·基于人工标准的指标第44-46页
   ·本章小结第46-47页
第四章 实验与结果分析第47-52页
   ·实验环境与实验数据第47页
   ·实验设计第47-48页
   ·实验过程的关键步骤描述第48页
   ·实验结果分析第48-51页
     ·两类主题聚类实验对比第49-50页
     ·多类主题的聚类实验第50-51页
   ·本章小结第51-52页
总结第52-54页
参考文献第54-57页
攻读硕士学位期间取得的研究成果第57-58页
致谢第58-59页
附件第59页

论文共59页,点击 下载论文
上一篇:基于Solr的企业级检索系统的设计与实现
下一篇:基于SQLite的分布式数据同步技术研究与实现