摘要 | 第1-6页 |
ABSTRACT | 第6-11页 |
第一章 绪论 | 第11-19页 |
·研究背景 | 第11-15页 |
·研究概况 | 第15-18页 |
·主要研究内容 | 第18页 |
·研究目标 | 第18-19页 |
第二章 贝叶斯网络与 Filter 型特征选择算法综述 | 第19-29页 |
·贝叶斯网络的基础理论 | 第19-23页 |
·理论背景 | 第19-20页 |
·贝叶斯公式描述与实例 | 第20-21页 |
·贝叶斯网络描述与实例 | 第21-23页 |
·朴素贝叶斯分类器 | 第23-26页 |
·朴素贝叶斯分类器定义 | 第23页 |
·朴素贝叶斯分类模型 | 第23-26页 |
·Filter 型特征选择算法 | 第26-28页 |
·Filter 型特征选择算法 | 第26-27页 |
·Filter 型最优特征排序法 | 第27-28页 |
·本章小结 | 第28-29页 |
第三章 基于最小联合互信息亏损的最优特征选择算法 | 第29-36页 |
·信息论度量 | 第29-30页 |
·以联合互信息为基础的最优特征选择算法 | 第30-31页 |
·以最小联合互信息亏损为基础的最优特征子集搜索策略 | 第31-35页 |
·以最大条件互信息为基础的无差异特征子集搜索策略 | 第31-33页 |
·以最小条件互信息为基础的冗余特征删减策略 | 第33-35页 |
·本章小结 | 第35-36页 |
第四章 文本分类及算法设计 | 第36-47页 |
·文本分类 | 第36-37页 |
·文本分类定义 | 第36页 |
·文本分类应用 | 第36-37页 |
·基于文本分类的特征选择算法 | 第37-41页 |
·算法设计 | 第41-46页 |
·文本特征向量 | 第41页 |
·代码设计 | 第41-46页 |
·本章小结 | 第46-47页 |
第五章 实验分析 | 第47-59页 |
·实验平台 | 第47-49页 |
·Weka 开源数据挖掘开发平台介绍 | 第47页 |
·Weka 中重要的类与方法 | 第47-48页 |
·实验样本选择 | 第48-49页 |
·文本分类过程 | 第49-50页 |
·训练样本处理 | 第50-55页 |
·训练样本分词 | 第50-51页 |
·去"停用词" | 第51-52页 |
·提取初步特征 | 第52页 |
·互信息计算、特征属性选择 | 第52-54页 |
·文档特征向量(权重为 tf-idf 值)计算 | 第54-55页 |
·样本训练 | 第55页 |
·测试样本处理 | 第55-57页 |
·特征选择算法运行时间及复杂度比较 | 第57-58页 |
·实验总结 | 第58-59页 |
第六章 结论 | 第59-61页 |
·工作总结 | 第59页 |
·研究展望 | 第59-61页 |
致谢 | 第61-62页 |
参考文献 | 第62-66页 |
附录 | 第66-78页 |