首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文文本分类特征选择方法的分析与研究

摘要第1-4页
Abstract第4-10页
第一章 绪论第10-16页
   ·研究背景及意义第10-11页
   ·研究现状第11-13页
     ·国外研究现状第11-12页
     ·国内研究现状第12-13页
   ·论文研究内容第13-14页
   ·论文结构第14-16页
第二章 文本分类相关技术概述第16-34页
   ·文本分类过程第16-17页
   ·语料集第17-18页
     ·均衡语料集第18页
     ·不均衡语料集第18页
   ·文本预处理第18-20页
     ·分词第18-19页
     ·词干抽取第19-20页
     ·停用词处理第20页
   ·特征降维第20-23页
     ·特征变换第21页
     ·特征选择第21-23页
   ·常用的特征选择方法第23-25页
     ·文档频数(Document Frequency)第23-24页
     ·互信息(Mutual Information)第24页
     ·信息增益(Information Gain)第24-25页
     ·期望交叉熵(Expected Cross Entropy)第25页
     ·卡方统计(CHI)第25页
   ·文本表示模型第25-27页
     ·概率模型第26页
     ·布尔模型第26页
     ·向量空间模型第26-27页
   ·不同分类算法第27-31页
     ·K邻近分类算法第28-29页
     ·SVM分类算法第29-30页
     ·贝叶斯分类算法第30-31页
   ·分类性能评价标准第31-33页
     ·查全率和查准率第31-32页
     ·宏平均和微平均第32-33页
   ·本章小结第33-34页
第三章 信息增益特征选择方法的研究第34-44页
   ·引言第34-35页
   ·信息增益特征选择方法第35-36页
     ·信息熵第35页
     ·条件熵第35-36页
     ·信息增益特征选择方法第36页
   ·信息增益方法的不足及改进方案第36-38页
   ·实验验证第38-42页
     ·语料集第38-39页
     ·分类算法第39页
     ·比例因子α的取值第39-40页
     ·实验分析第40-42页
   ·改进后的算法复杂度分析第42页
   ·本章小结第42-44页
第四章 互信息特征选择方法的研究第44-52页
   ·引言第44页
   ·互信息特征选择方法第44-46页
     ·联合熵第44-45页
     ·互信息第45-46页
   ·互信息特征选择方法的分析与改进第46-48页
   ·实验数据及分析第48-50页
     ·语料集第48-49页
     ·分类器第49页
     ·实验分析第49-50页
   ·改进后的算法复杂度分析第50页
   ·本章小结第50-52页
第五章 中文文本分类系统的设计与实现第52-68页
   ·开发环境第52页
   ·设计分类系统需考虑的因素第52-53页
   ·分类系统设计第53-59页
     ·文本分类流程第53页
     ·系统用例图第53-54页
     ·系统主要模块分析与设计第54-58页
     ·系统详细设计第58-59页
   ·分类系统实现第59-64页
     ·划分语料集功能实现第59-60页
     ·训练模块实现第60-62页
     ·分类模块实现第62-63页
     ·结果评估及显示模块实现第63-64页
   ·各种特征选择方法在不同分类器上的性能比较第64-66页
     ·实验环境第64页
     ·语料集第64-65页
     ·实验数据及分析第65-66页
   ·本章小结第66-68页
总结与展望第68-72页
 1. 总结第68-70页
 2. 展望第70-72页
参考文献第72-76页
攻读学位期间发表的论文第76-77页
致谢第77页

论文共77页,点击 下载论文
上一篇:协作式标注图像检索方法研究
下一篇:仿射传播聚类算法在图像检索中的应用研究