摘要 | 第1-7页 |
目录 | 第7-9页 |
第一章 引言 | 第9-14页 |
·课题研究的背景和意义 | 第9页 |
·国外研究状况 | 第9-11页 |
·国内研究状况 | 第11-12页 |
·主要工作与本文的结构 | 第12-14页 |
第二章 文本自动分类的相关模型 | 第14-25页 |
·文本自动分类的定义 | 第14-15页 |
·分类常用模型 | 第15-19页 |
·向量空间模型(VSM,Vector Space Model) | 第15-16页 |
·潜在语义索引(LSI)模型 | 第16-19页 |
·贝叶斯概率模型 | 第19页 |
·自动分类常用算法介绍 | 第19-25页 |
·中心向量法 | 第19-20页 |
·朴素贝叶斯方法(Naive Bayes) | 第20-21页 |
·K-近邻算法(KNN) | 第21页 |
·支持向量机(SVM) | 第21-25页 |
第三章 文本自动分类器构造 | 第25-35页 |
·文本预处理 | 第25页 |
·文本特征描述 | 第25-28页 |
·特征提取 | 第25-28页 |
·特征重构 | 第28页 |
·分类器构造 | 第28-34页 |
·训练文本特征项权重计算 | 第29页 |
·待分类文本特征项权重计算 | 第29-30页 |
·分类器构造算法 | 第30-34页 |
·阈值的确定 | 第34-35页 |
·文本自动分类系统的结构框架 | 第35页 |
第四章 实验设置与结果分析 | 第35-47页 |
·实验用语料库 | 第36-37页 |
·国家语委现代汉语平衡语料库 | 第36页 |
·新浪网网页语料 | 第36-37页 |
·实验环境 | 第37页 |
·实验评测标准 | 第37-38页 |
·实验项目 | 第38页 |
·实验结果分析 | 第38-45页 |
·网页自动分类实验 | 第45-47页 |
第五章 分类器算法的改进 | 第47-51页 |
·改进算法 | 第47-49页 |
·实验结果分析 | 第49-51页 |
第六章 结论与展望 | 第51-53页 |
·全文总结 | 第51-52页 |
·展望 | 第52-53页 |
致谢 | 第53-54页 |
硕士阶段参加的课题与发表的论文 | 第54-55页 |
参考文献 | 第55-60页 |