| 摘要 | 第1-6页 |
| Abstract | 第6-9页 |
| 第一章 绪论 | 第9-15页 |
| ·选题背景及研究意义 | 第9-10页 |
| ·与本课题相关的国内外现状分析 | 第10-12页 |
| ·国外现状分析 | 第10-11页 |
| ·国内现状分析 | 第11-12页 |
| ·本文具体工作 | 第12-14页 |
| ·本文的主要研究内容 | 第12-13页 |
| ·文本结构 | 第13-14页 |
| ·本章小结 | 第14-15页 |
| 第二章 中文文本的预处理技术 | 第15-30页 |
| ·文本分类综述 | 第15-17页 |
| ·文本分类的基本定义 | 第15页 |
| ·文本分类的主要流程 | 第15-17页 |
| ·文本预处理操作 | 第17-20页 |
| ·文本格式标记的处理 | 第17页 |
| ·中文分词技术 | 第17-18页 |
| ·机械分词的优缺点及其解决办法 | 第18-20页 |
| ·文本数据的表示模型 | 第20-23页 |
| ·布尔模型 | 第21页 |
| ·概率模型 | 第21-22页 |
| ·向量空间模型 | 第22-23页 |
| ·特征选择算法 | 第23-27页 |
| ·特征权重算法 | 第27-28页 |
| ·本章小结 | 第28-30页 |
| 第三章 加权贝叶斯文本分类的增量学习方法 | 第30-46页 |
| ·文本分类算法简介 | 第30-33页 |
| ·决策树(DT)分类算法 | 第30页 |
| ·KNN(K Nearest Neighbor)分类算法 | 第30-31页 |
| ·支持向量机(SVM)分类算法 | 第31-33页 |
| ·贝叶斯理论概述 | 第33-35页 |
| ·贝叶斯定理、先验以及后验 | 第33-34页 |
| ·beta分布与Dirichlet分布 | 第34-35页 |
| ·朴素贝叶斯分类概述 | 第35-39页 |
| ·朴素贝叶斯分类器 | 第35-37页 |
| ·朴素贝叶斯分类器的提升 | 第37-39页 |
| ·朴素贝叶斯文本分类 | 第39-40页 |
| ·增量贝叶斯分类模型 | 第40-41页 |
| ·加权贝叶斯的增量学习模型 | 第41-42页 |
| ·加权贝叶斯文本分类的增量学习方法 | 第42-45页 |
| ·本章小结 | 第45-46页 |
| 第四章 实验与分析 | 第46-54页 |
| ·分类评估指标 | 第46-47页 |
| ·实验源数据与预处理说明 | 第47-48页 |
| ·不同特征选择算法对分类效果的影响 | 第48-51页 |
| ·加权增量学习方法性能测试 | 第51-53页 |
| ·本章小结 | 第53-54页 |
| 总结和展望 | 第54-56页 |
| 总结 | 第54-55页 |
| 展望 | 第55-56页 |
| 参考文献 | 第56-58页 |
| 致谢 | 第58-59页 |
| 附录 攻读学位期间发表论文目录 | 第59页 |