首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文文本聚类中特征选择算法的研究

摘要第1-6页
Abstract第6-9页
第一章 绪论第9-15页
   ·引言第9-10页
   ·文本聚类研究概述第10-13页
     ·文本聚类的定义第10-11页
     ·文本聚类的研究现状和发展趋势第11-13页
   ·本文的研究目的第13-14页
   ·本文的研究内容第14-15页
第二章 文本聚类中的词语权值计算第15-22页
   ·基本概念第15-17页
     ·文本预处理第15-17页
     ·向量空间模型第17页
   ·多重因子加权的词语权值计算方法第17-20页
     ·频率加权因子第18-19页
     ·语义加权因子第19-20页
   ·基于多重因子加权的词语权值计算算法第20-22页
第三章 用于文本聚类的特征选择算法第22-28页
   ·特征选择的概念第22-24页
   ·常用的文本聚类的特征选择方法第24-26页
     ·文档频数(DF)第24-25页
     ·单词权(TS)第25页
     ·单词熵(EN)第25-26页
   ·一种新的无监督的特征选择方法——单词贡献度(TD)第26-27页
   ·计算单词贡献度的算法第27-28页
第四章 文本聚类算法第28-35页
   ·文本聚类过程第28-29页
   ·三种常用的文本聚类算法第29-31页
     ·DBSCAN算法第29页
     ·Single-Link算法第29-30页
     ·k-means算法第30-31页
   ·一种改进的k-means算法第31-35页
     ·新的初始中心选择思路第31-32页
     ·新的初始中心选择算法第32-33页
     ·改进的k-means算法描述第33-35页
第五章 比较实验第35-43页
   ·文本聚类结果的评价方法第35-36页
   ·实验及结果分析第36-43页
     ·权值计算方法的比较实验第36-37页
     ·特征选择算法的比较实验第37-40页
     ·聚类算法的比较实验第40-43页
总结与展望第43-44页
参考文献第44-48页
攻读硕士期间公开发表的论文第48-49页
致谢第49页

论文共49页,点击 下载论文
上一篇:洞庭湖粮食主产区农民收入波动预警研究
下一篇:水疱性口炎病毒M蛋白体外诱导肺癌细胞凋亡的研究