| 摘要 | 第1-6页 |
| ABSTRACT | 第6-11页 |
| 第一章 绪论 | 第11-19页 |
| ·研究背景 | 第11-15页 |
| ·研究概况 | 第15-18页 |
| ·主要研究内容 | 第18页 |
| ·研究目标 | 第18-19页 |
| 第二章 贝叶斯网络与 Filter 型特征选择算法综述 | 第19-29页 |
| ·贝叶斯网络的基础理论 | 第19-23页 |
| ·理论背景 | 第19-20页 |
| ·贝叶斯公式描述与实例 | 第20-21页 |
| ·贝叶斯网络描述与实例 | 第21-23页 |
| ·朴素贝叶斯分类器 | 第23-26页 |
| ·朴素贝叶斯分类器定义 | 第23页 |
| ·朴素贝叶斯分类模型 | 第23-26页 |
| ·Filter 型特征选择算法 | 第26-28页 |
| ·Filter 型特征选择算法 | 第26-27页 |
| ·Filter 型最优特征排序法 | 第27-28页 |
| ·本章小结 | 第28-29页 |
| 第三章 基于最小联合互信息亏损的最优特征选择算法 | 第29-36页 |
| ·信息论度量 | 第29-30页 |
| ·以联合互信息为基础的最优特征选择算法 | 第30-31页 |
| ·以最小联合互信息亏损为基础的最优特征子集搜索策略 | 第31-35页 |
| ·以最大条件互信息为基础的无差异特征子集搜索策略 | 第31-33页 |
| ·以最小条件互信息为基础的冗余特征删减策略 | 第33-35页 |
| ·本章小结 | 第35-36页 |
| 第四章 文本分类及算法设计 | 第36-47页 |
| ·文本分类 | 第36-37页 |
| ·文本分类定义 | 第36页 |
| ·文本分类应用 | 第36-37页 |
| ·基于文本分类的特征选择算法 | 第37-41页 |
| ·算法设计 | 第41-46页 |
| ·文本特征向量 | 第41页 |
| ·代码设计 | 第41-46页 |
| ·本章小结 | 第46-47页 |
| 第五章 实验分析 | 第47-59页 |
| ·实验平台 | 第47-49页 |
| ·Weka 开源数据挖掘开发平台介绍 | 第47页 |
| ·Weka 中重要的类与方法 | 第47-48页 |
| ·实验样本选择 | 第48-49页 |
| ·文本分类过程 | 第49-50页 |
| ·训练样本处理 | 第50-55页 |
| ·训练样本分词 | 第50-51页 |
| ·去"停用词" | 第51-52页 |
| ·提取初步特征 | 第52页 |
| ·互信息计算、特征属性选择 | 第52-54页 |
| ·文档特征向量(权重为 tf-idf 值)计算 | 第54-55页 |
| ·样本训练 | 第55页 |
| ·测试样本处理 | 第55-57页 |
| ·特征选择算法运行时间及复杂度比较 | 第57-58页 |
| ·实验总结 | 第58-59页 |
| 第六章 结论 | 第59-61页 |
| ·工作总结 | 第59页 |
| ·研究展望 | 第59-61页 |
| 致谢 | 第61-62页 |
| 参考文献 | 第62-66页 |
| 附录 | 第66-78页 |