摘要 | 第1-4页 |
Abstract | 第4-7页 |
第一章 绪论 | 第7-14页 |
1.1 Web资源的特点 | 第7-8页 |
1.2 Web挖掘 | 第8-10页 |
1.2.1 Web挖掘的定义 | 第8页 |
1.2.2 Web挖掘的分类 | 第8-10页 |
1.3 Web文档分类技术的研究现状与研究意义 | 第10-12页 |
1.4 贝叶斯方法与Web挖掘 | 第12页 |
1.5 本文的主要工作及结构组织 | 第12-14页 |
第二章 贝叶斯分类器 | 第14-25页 |
2.1 贝叶斯理论 | 第14-15页 |
2.1.1 贝叶斯理论的出现及发展 | 第14页 |
2.1.2 贝叶斯定理 | 第14-15页 |
2.2 贝叶斯网络 | 第15-18页 |
2.2.1 贝叶斯网络的描述 | 第15-16页 |
2.2.2 贝叶斯网络的学习 | 第16-18页 |
2.2.3 贝叶斯网络的优点 | 第18页 |
2.3 基于贝叶斯网络的分类器 | 第18-25页 |
2.3.1 朴素贝叶斯分类器 | 第19-20页 |
2.3.2 朴素贝叶斯的扩展模型 | 第20-22页 |
2.3.3 不受限的贝叶斯网络分类器 | 第22-25页 |
第三章 Web文档分类基础 | 第25-37页 |
3.1 Web文档分类 | 第25-26页 |
3.1.1 Web文档的特点 | 第25-26页 |
3.1.2 Web文档的分类过程 | 第26页 |
3.2 自动文本分类中的关键技术 | 第26-37页 |
3.2.1 向量空间模型 | 第27-28页 |
3.2.2 中文分词 | 第28-29页 |
3.2.3 特征选择 | 第29-33页 |
3.2.4 分类算法 | 第33-36页 |
3.2.5 分类器的性能评价 | 第36-37页 |
第四章 基于NB的网页文本分类 | 第37-51页 |
4.1 朴素贝叶斯文本分类器的构造 | 第37-39页 |
4.1.1 分类任务的描述 | 第37-38页 |
4.1.2 数据集的准备 | 第38-39页 |
4.1.3 数据预处理 | 第39页 |
4.2 特征选择对比实验 | 第39-46页 |
4.2.1 实验目的 | 第39-40页 |
4.2.2 实验结果与分析 | 第40-45页 |
4.2.3 相关讨论 | 第45-46页 |
4.3 多文本分类器的组合 | 第46-51页 |
4.3.1 结合Bagging思想的文本组合分类 | 第46-47页 |
4.3.2 结合Boosting思想的文本组合分类 | 第47-49页 |
4.3.3 实验结果 | 第49-51页 |
第五章 基于文档结构的贝叶斯网络分类模型 | 第51-58页 |
5.1 Web文档的层次结构 | 第51-52页 |
5.2 利用文档结构描述文档的方法 | 第52-53页 |
5.3 基于文档结构的朴素贝叶斯分类 | 第53页 |
5.4 利用贝叶斯网络表示和分类文档 | 第53-58页 |
第六章 总结与展望 | 第58-59页 |
参考文献 | 第59-63页 |
致谢 | 第63-64页 |
攻读硕士期间发表的论文 | 第64页 |