首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于粒度计算的文本分类技术研究

摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-15页
   ·研究背景第9页
   ·研究意义第9-10页
     ·信息检索第9-10页
     ·信息过滤第10页
     ·数字图书馆第10页
   ·基于机器学习的知识发现技术在文本分类中的应用第10-11页
   ·文本分类技术流程第11-12页
   ·研究现状第12-14页
   ·本文研究内容第14-15页
第二章 文本分类技术[2-27]第15-27页
   ·文本分类任务第15页
   ·文本表示模型第15-16页
   ·文本预处理第16页
   ·特征选择和特征抽取第16-20页
     ·文档频率(Document Frequency,DF)第16-17页
     ·信息增益(Information Gain)第17页
     ·期望交叉熵(Expected Cross Entropy,ECE)第17页
     ·互信息(Mutual Information)第17页
     ·CHI 统计量第17-18页
     ·GSS 系数第18页
     ·NGL 系数第18-19页
     ·几率比(Odds Ratio)第19-20页
   ·分类方法第20-24页
     ·决策树(Decision Trees)第20页
     ·KNN 算法(K-Nearest Neighbor)第20-21页
     ·朴素贝叶斯(Na ve Bayes)分类第21页
     ·人工神经网络(Artificial Neural Network, ANN)第21-22页
     ·支持向量机(SVM)第22-23页
     ·粗糙集第23-24页
   ·分类性能评估第24-27页
     ·查全率和查准率第24-25页
     ·宏平均和微平均第25-27页
第三章 基于分布距离的特征聚类方法第27-35页
   ·引言第27页
   ·文本特征降维第27-28页
     ·降维对分类的影响第27页
     ·特征选择第27-28页
     ·特征抽取第28页
   ·基于分布距离的特征聚类第28-30页
     ·特征聚类第28页
     ·特征分布距离第28-30页
     ·聚类步骤第30页
   ·实验结果及分析第30-33页
   ·结论第33-35页
第四章 粒度计算的粗糙集理论模型[34-47]第35-43页
   ·粒度计算概述第35-36页
   ·粗糙集基本理论第36-39页
     ·信息表和不可分辨关系第36-37页
     ·上下近似关系第37页
     ·属性依赖第37-38页
     ·属性约简第38-39页
   ·决策规则及其测度第39页
   ·规则匹配及规则冲突解决[24]第39-40页
   ·约简算法第40-43页
     ·基于可分辨矩阵的属性约简算法[28]第41-42页
     ·基于属性重要性的属性约简算法第42-43页
第五章 基于粒度计算的文本分类方法研究[25-30]第43-55页
   ·基于粒度计算的文本分类方法流程第43页
   ·训练集粒化分解第43-44页
   ·构造粒度决策表第44页
   ·文本粒度属性约简第44-48页
     ·构建协同矩阵第44-45页
     ·最相似样本第45-46页
     ·启发式搜索最相似样本第46-48页
   ·规则不一致解决方法第48页
   ·分类算法描述第48-49页
     ·信息粒度规则获取第48-49页
     ·信息粒度属性约简第49页
   ·实验结果及分析第49-54页
     ·训练第49-53页
     ·测试第53-54页
   ·本章小结第54-55页
总结与展望第55-56页
参考文献第56-59页
致谢第59-60页
个人简介第60页

论文共60页,点击 下载论文
上一篇:可控硅触发控制系统核心SOC的设计
下一篇:根霉源酸性蛋白酶的初步研究