首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

文本分类中特征选择的研究与实现

摘要第1-4页
Abstract第4-8页
第一章 绪论第8-13页
   ·研究背景第8-9页
   ·研究现状第9-10页
   ·研究内容第10-11页
   ·论文组织第11-13页
第二章 中文文本分类技术第13-29页
   ·文本分类过程第13页
   ·语料库第13-14页
   ·文本预处理第14-16页
     ·中文分词第14-15页
     ·去除停用词第15-16页
     ·词干还原第16页
   ·文本表示第16-17页
     ·向量空间模型第16-17页
     ·概率模型第17页
     ·LSA模型第17页
   ·特征降维第17-23页
     ·特征选择步骤第18-20页
     ·特征选择的分类第20-22页
     ·典型特征选择算法介绍第22-23页
   ·常用的特征选择方法第23-25页
     ·互信息第23页
     ·信息增益第23-24页
     ·CHI统计方法第24-25页
     ·文档频率第25页
   ·分类算法第25-27页
     ·线性分类算法第25-26页
     ·非线性分类算法第26-27页
   ·分类评价标准第27-28页
     ·查全率第28页
     ·查准率第28页
     ·平均F1值第28页
   ·本章小结第28-29页
第三章 互信息特征选择方法分析与改进第29-40页
   ·引言第29-30页
   ·互信息特征选择方法第30-32页
     ·信息熵第30-31页
     ·联合熵与条件熵第31页
     ·互信息特征选择方法第31-32页
   ·互信息特征选择方法的改进第32-34页
     ·调整正负相关特征比例第32-33页
     ·区分类强相关特征第33-34页
   ·实验结果及分析第34-39页
     ·语料集第34页
     ·分类器第34页
     ·平衡因子α选取第34-35页
     ·实验数据第35-39页
   ·本章小结第39-40页
第四章 卡方统计特征选择方法分析与改进第40-50页
   ·引言第40-41页
   ·卡方检验和卡方统计第41-42页
     ·卡方检验第41页
     ·卡方统计第41-42页
     ·卡方统计特征选择方法第42页
   ·卡方统计特征选择方法改进第42-45页
     ·选择低频特征第42-43页
     ·选择高频特征第43-44页
     ·选择强相关特征第44-45页
   ·实验结果第45-49页
     ·语料集第46页
     ·分类器第46页
     ·实验数据第46-49页
   ·本章小结第49-50页
第五章 文本分类系统的设计与实现第50-64页
   ·开发环境与开发工具第50页
   ·开发系统考虑因素第50-51页
   ·分类系统体系结构第51-52页
   ·系统设计第52-56页
     ·系统用例图及用例描述第52-53页
     ·系统功能模块设计第53-54页
     ·系统概要设计第54-56页
   ·系统实现第56-61页
     ·训练集选择模块实现第56-58页
     ·文本训练模块实现第58-59页
     ·文本分类模块实现第59-60页
     ·结果评测模块实现第60-61页
   ·常用特征选择方法分类效果研究第61-63页
     ·实验环境第61页
     ·语料库选取第61-62页
     ·实验结果分析第62-63页
   ·本章小结第63-64页
总结与展望第64-66页
参考文献第66-69页
攻读学位期间发表的论文第69-70页
致谢第70页

论文共70页,点击 下载论文
上一篇:基于单目视觉ASL字母手势检测与识别技术研究
下一篇:基于综合相似度计算的中文本体映射技术研究与实现