| 中文摘要 | 第1-5页 |
| 英文摘要 | 第5-11页 |
| 1 绪论 | 第11-17页 |
| ·研究背景 | 第11-12页 |
| ·研究现状 | 第12-14页 |
| ·论文主要工作 | 第14-16页 |
| ·论文组织结构 | 第16-17页 |
| 2 文档分类相关技术 | 第17-33页 |
| ·文档分类 | 第17-18页 |
| ·问题描述 | 第17页 |
| ·多类别文档分类 | 第17-18页 |
| ·文档聚类 | 第18-19页 |
| ·文档表示 | 第19-21页 |
| ·文档特征 | 第19页 |
| ·向量空间模型 | 第19-21页 |
| ·文档预处理 | 第21-23页 |
| ·特征选择 | 第21-22页 |
| ·特征抽取 | 第22-23页 |
| ·文档分类模型 | 第23-28页 |
| ·贝叶斯模型 | 第23-25页 |
| ·支持向量机 | 第25-26页 |
| ·k 近邻分类器 | 第26-27页 |
| ·决策树 | 第27-28页 |
| ·标准数据集 | 第28-30页 |
| ·分类器性能评价 | 第30-31页 |
| ·本章小结 | 第31-33页 |
| 3 贝叶斯分类模型 | 第33-43页 |
| ·概述 | 第33页 |
| ·朴素贝叶斯模型 | 第33-35页 |
| ·半朴素贝叶斯模型 | 第35-36页 |
| ·树形增强朴素贝叶斯模型 | 第36-37页 |
| ·TAN 扩展模型 | 第37页 |
| ·贝叶斯增量模型 | 第37-38页 |
| ·实验结果与分析 | 第38-42页 |
| ·本章小结 | 第42-43页 |
| 4 文档特征选择算法研究与改进 | 第43-59页 |
| ·概述 | 第43页 |
| ·特征选择算法研究 | 第43-47页 |
| ·Focus 算法 | 第45-46页 |
| ·Relief 算法 | 第46-47页 |
| ·基于关联特征扩展的特征选择算法 | 第47-49页 |
| ·基本思想 | 第47-48页 |
| ·相关性分析测度 | 第48-49页 |
| ·EFFS 算法分析 | 第49-51页 |
| ·关联特征集创建 | 第49页 |
| ·特征选择 | 第49-51页 |
| ·实验结果与分析 | 第51-57页 |
| ·实验设置 | 第51-52页 |
| ·实验结果分析 | 第52-57页 |
| ·本章小结 | 第57-59页 |
| 5 贝叶斯潜在语义模型 | 第59-75页 |
| ·引言 | 第59页 |
| ·基于词vs 概念的文档分类 | 第59-60页 |
| ·本体库与WordNet | 第60-61页 |
| ·相关研究 | 第61-63页 |
| ·概念特征扩展 | 第61-62页 |
| ·潜在语义分析 | 第62-63页 |
| ·贝叶斯潜在语义模型分析 | 第63-68页 |
| ·贝叶斯潜在语义模型 | 第63-66页 |
| ·模型优化 | 第66-68页 |
| ·实验结果与分析 | 第68-73页 |
| ·实验设置 | 第68-69页 |
| ·实验结果与分析 | 第69-73页 |
| ·本章小结 | 第73-75页 |
| 6 一种新的半监督语义分类模型 | 第75-93页 |
| ·引言 | 第75-76页 |
| ·相关研究 | 第76-77页 |
| ·EM 算法 | 第76页 |
| ·TSVM | 第76页 |
| ·Self-training 算法 | 第76页 |
| ·Co-training 算法 | 第76-77页 |
| ·主动采样方法 | 第77页 |
| ·新的半监督语义分类模型 | 第77-85页 |
| ·算法框架 | 第78-79页 |
| ·语义支持向量机 | 第79-81页 |
| ·样本主动选择方法 | 第81-83页 |
| ·分类判决集成 | 第83-85页 |
| ·实验结果与分析 | 第85-91页 |
| ·实验设置 | 第85页 |
| ·实验结果 | 第85-91页 |
| ·进一步的讨论 | 第91-92页 |
| ·本章小结 | 第92-93页 |
| 7 语言无关的贝叶斯集成分类模型 | 第93-111页 |
| ·引言 | 第93-94页 |
| ·集成分类模型研究 | 第94-96页 |
| ·概述 | 第94页 |
| ·集成的差异性及其度量 | 第94-95页 |
| ·判决集成 | 第95-96页 |
| ·提高集成的差异性和语言独立性 | 第96-99页 |
| ·问题提出 | 第96页 |
| ·贝叶斯分量模型 | 第96-99页 |
| ·贝叶斯集成创建 | 第99页 |
| ·自适应判决集成方法 | 第99-104页 |
| ·问题描述 | 第99-100页 |
| ·Clustering and Selection | 第100-101页 |
| ·Dempster-Shafer 方法 | 第101-102页 |
| ·CS+DS 集成方法 | 第102-104页 |
| ·实验结果与分析 | 第104-108页 |
| ·实验设置 | 第104页 |
| ·实验结果 | 第104-108页 |
| ·本章小结 | 第108-111页 |
| 8 总结 | 第111-113页 |
| ·论文取得的成果 | 第111-112页 |
| ·进一步的工作 | 第112-113页 |
| 致谢 | 第113-115页 |
| 参考文献 | 第115-123页 |
| 附录:作者在攻读博士期间科研工作和论文发表目录 | 第123-124页 |