首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--一般性问题论文--理论、方法论文--算法理论论文

基于粗糙集的文本分类算法研究

摘要第1-5页
ABSTRACT第5-10页
第一章 绪论第10-14页
   ·引言第10页
   ·文本分类的研究背景和意义第10-11页
   ·国内外相关研究第11-13页
     ·国外自动分类研究动态第11-12页
     ·国内研究情况第12-13页
   ·论文框架第13-14页
第二章 粗糙集理论、WEB 挖掘和文本分类第14-24页
   ·引言第14页
   ·粗糙集基本概念第14-17页
     ·粗糙集定义第14页
     ·知识与不分明关系第14-15页
     ·粗糙集与近似第15-16页
     ·近似精度第16-17页
   ·数据集的约简第17-20页
     ·决策表第17-18页
     ·约简与核第18-19页
     ·可辨识矩阵第19-20页
   ·规则集第20页
   ·WEB 挖掘及其分类第20-21页
     ·Web 挖掘第20-21页
     ·Web 挖掘的分类第21页
   ·文本分类算法第21-24页
     ·简单中心向量比较算法第21-22页
     ·支持向量机方法第22-23页
     ·k 近邻法第23-24页
第三章 文本特征提取第24-35页
   ·文本的预处理第24-31页
     ·文本的表示第24-27页
     ·特征项的选择第27-28页
     ·停用词的过滤第28页
     ·中文分词面临的问题第28-29页
     ·中文分词方法第29-30页
     ·设置位置系数第30-31页
   ·文本特征选择方法第31-35页
     ·互信息第31页
     ·χ~2 统计量第31-32页
     ·文档频率第32页
     ·信息增益第32-33页
     ·期望交叉熵第33-35页
第四章 权重计算第35-39页
   ·常用的权重函数第35-36页
     ·布尔权重函数第35页
     ·TF-IDF第35-36页
     ·ITC第36页
     ·ENTROPY第36页
     ·Okapi第36页
   ·OKAPI 函数的改进第36-37页
   ·权重的离散化第37-39页
     ·等距离划分算法第37页
     ·等频率划分算法第37-38页
     ·Chi-merge 离散化方法第38-39页
第五章 基于粗糙集理论的分类算法研究第39-44页
   ·基于粗糙集的文本分类方法的流程第39-40页
   ·关键技术第40-41页
     ·预处理第40页
     ·特征项提取第40页
     ·特征项权值的离散化第40-41页
     ·决策表的构造第41页
     ·决策规则的表示第41页
   ·文本分类实验第41-44页
     ·试验评估方法第41-42页
     ·试验数据及实验结果第42-44页
结束语第44-45页
参考文献第45-47页
致谢第47页

论文共47页,点击 下载论文
上一篇:汉黄芩苷对人肝癌细胞BEL-7402的抑制作用研究
下一篇:刑事被害人视野中的恢复性司法