| 摘要 | 第1-7页 |
| 目录 | 第7-9页 |
| 第一章 引言 | 第9-14页 |
| ·课题研究的背景和意义 | 第9页 |
| ·国外研究状况 | 第9-11页 |
| ·国内研究状况 | 第11-12页 |
| ·主要工作与本文的结构 | 第12-14页 |
| 第二章 文本自动分类的相关模型 | 第14-25页 |
| ·文本自动分类的定义 | 第14-15页 |
| ·分类常用模型 | 第15-19页 |
| ·向量空间模型(VSM,Vector Space Model) | 第15-16页 |
| ·潜在语义索引(LSI)模型 | 第16-19页 |
| ·贝叶斯概率模型 | 第19页 |
| ·自动分类常用算法介绍 | 第19-25页 |
| ·中心向量法 | 第19-20页 |
| ·朴素贝叶斯方法(Naive Bayes) | 第20-21页 |
| ·K-近邻算法(KNN) | 第21页 |
| ·支持向量机(SVM) | 第21-25页 |
| 第三章 文本自动分类器构造 | 第25-35页 |
| ·文本预处理 | 第25页 |
| ·文本特征描述 | 第25-28页 |
| ·特征提取 | 第25-28页 |
| ·特征重构 | 第28页 |
| ·分类器构造 | 第28-34页 |
| ·训练文本特征项权重计算 | 第29页 |
| ·待分类文本特征项权重计算 | 第29-30页 |
| ·分类器构造算法 | 第30-34页 |
| ·阈值的确定 | 第34-35页 |
| ·文本自动分类系统的结构框架 | 第35页 |
| 第四章 实验设置与结果分析 | 第35-47页 |
| ·实验用语料库 | 第36-37页 |
| ·国家语委现代汉语平衡语料库 | 第36页 |
| ·新浪网网页语料 | 第36-37页 |
| ·实验环境 | 第37页 |
| ·实验评测标准 | 第37-38页 |
| ·实验项目 | 第38页 |
| ·实验结果分析 | 第38-45页 |
| ·网页自动分类实验 | 第45-47页 |
| 第五章 分类器算法的改进 | 第47-51页 |
| ·改进算法 | 第47-49页 |
| ·实验结果分析 | 第49-51页 |
| 第六章 结论与展望 | 第51-53页 |
| ·全文总结 | 第51-52页 |
| ·展望 | 第52-53页 |
| 致谢 | 第53-54页 |
| 硕士阶段参加的课题与发表的论文 | 第54-55页 |
| 参考文献 | 第55-60页 |