首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

最优特征选择算法在文本分类上的应用研究

摘要第1-6页
ABSTRACT第6-11页
第一章 绪论第11-19页
   ·研究背景第11-15页
   ·研究概况第15-18页
   ·主要研究内容第18页
   ·研究目标第18-19页
第二章 贝叶斯网络与 Filter 型特征选择算法综述第19-29页
   ·贝叶斯网络的基础理论第19-23页
     ·理论背景第19-20页
     ·贝叶斯公式描述与实例第20-21页
     ·贝叶斯网络描述与实例第21-23页
   ·朴素贝叶斯分类器第23-26页
     ·朴素贝叶斯分类器定义第23页
     ·朴素贝叶斯分类模型第23-26页
   ·Filter 型特征选择算法第26-28页
     ·Filter 型特征选择算法第26-27页
     ·Filter 型最优特征排序法第27-28页
   ·本章小结第28-29页
第三章 基于最小联合互信息亏损的最优特征选择算法第29-36页
   ·信息论度量第29-30页
   ·以联合互信息为基础的最优特征选择算法第30-31页
   ·以最小联合互信息亏损为基础的最优特征子集搜索策略第31-35页
     ·以最大条件互信息为基础的无差异特征子集搜索策略第31-33页
     ·以最小条件互信息为基础的冗余特征删减策略第33-35页
   ·本章小结第35-36页
第四章 文本分类及算法设计第36-47页
   ·文本分类第36-37页
     ·文本分类定义第36页
     ·文本分类应用第36-37页
   ·基于文本分类的特征选择算法第37-41页
   ·算法设计第41-46页
     ·文本特征向量第41页
     ·代码设计第41-46页
   ·本章小结第46-47页
第五章 实验分析第47-59页
   ·实验平台第47-49页
     ·Weka 开源数据挖掘开发平台介绍第47页
     ·Weka 中重要的类与方法第47-48页
     ·实验样本选择第48-49页
   ·文本分类过程第49-50页
   ·训练样本处理第50-55页
     ·训练样本分词第50-51页
     ·去"停用词"第51-52页
     ·提取初步特征第52页
     ·互信息计算、特征属性选择第52-54页
     ·文档特征向量(权重为 tf-idf 值)计算第54-55页
     ·样本训练第55页
   ·测试样本处理第55-57页
   ·特征选择算法运行时间及复杂度比较第57-58页
   ·实验总结第58-59页
第六章 结论第59-61页
   ·工作总结第59页
   ·研究展望第59-61页
致谢第61-62页
参考文献第62-66页
附录第66-78页

论文共78页,点击 下载论文
上一篇:基于指纹身份识别平台系统设计与实现
下一篇:抚顺工程建设公司人力资源信息管理系统的设计与实现