首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于粗糙集的文本分类技术研究

摘要第1-5页
Abstract第5-9页
第1章 绪论第9-13页
   ·论文研究的背景及意义第9-11页
   ·论文主要工作介绍第11-12页
   ·论文的结构和安排第12-13页
第2章 文本分类概述第13-26页
   ·文本分词(Text Segmentation)第13-16页
   ·特征选择(Feature Selection,FS)第15-16页
   ·文本描述(Text Respresentation)第16-19页
     ·布尔模型(Boolean Model)第16-17页
     ·空间向量模型(Vector Space Model)第17-18页
     ·概率模型(Probabilistic Model)第18-19页
   ·分类算法(Classification Algorithm)第19-26页
     ·朴素贝叶斯算法(Naive Bayes)第20页
     ·KNN(k-Nearest Neighbor)算法第20-21页
     ·基于神经网络的算法(Artificial Neural Networks)第21-23页
     ·决策树方法(Decision Tree)第23-24页
     ·粗糙集方法(Rough Set)第24-26页
第3章 基于特征选择的权值计算研究第26-34页
   ·常见特征选择方法第26-29页
     ·信息增益(Information Gain)第26-27页
     ·互信息(Mutual Information)第27页
     ·CHI2统计第27-28页
     ·交叉熵(Cross Entropy)第28页
     ·证据权值(Weight of Evidence)第28-29页
   ·经典权值计算公式TFIDF及其弊端第29-30页
   ·基于特征选择的TFIDF权值计算改进研究第30-31页
   ·实验设计和结果第31-34页
第4章 基于粗集理论的文本分类概述第34-44页
   ·粗集基本概念第34-39页
     ·信息系统第34-35页
     ·决策表信息系统第35-36页
     ·等价关系第36页
     ·不可分辨关系第36页
     ·近似空间第36-38页
     ·知识约简第38-39页
   ·基于粗糙集理论的文本分类系统第39-44页
     ·文本向量描述第41页
     ·权值离散化第41-42页
     ·构造决策信息表第42页
     ·进行决策信息表条件属性约简第42-43页
     ·对分类规则进行值约简第43页
     ·生成分类规则第43页
     ·对新文本进行分类第43-44页
第5章 粗糙集启发式属性约简的改进第44-58页
   ·属性重要性评价研究第44-47页
     ·粗糙集理论对属性重要性的代数形式衡量方法第44-46页
     ·基于文本特征选择的属性重要性的衡量方法第46页
     ·综合糙集理论和文本特征选择的属性重要性评价第46-47页
   ·启发式属性约简的研究和改进第47-49页
     ·基于空集基础上的属性约简算法第47-48页
     ·基于约简核基础上的属性约简算法第48页
     ·改进启发式属性约简算法第48-49页
   ·基于改进启发式属性约简的粗糙集文本分类系统第49-51页
   ·实验结果和分析第51-58页
     ·属性重要性的实验比较研究第51-56页
     ·改进启发式属性约简的实验比较研究第56-58页
总结与展望第58-60页
 全文总结第58-59页
 进一步研究工作展望第59-60页
致谢第60-61页
参考文献第61-66页
攻读硕士学位期间发表的论文第66页

论文共66页,点击 下载论文
上一篇:足球机器人体系结构研究及决策程序开发
下一篇:基于Oracle XML DB的电子病历系统的研究与实现