首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于统计方法的中文文本自动分类研究

摘要第1-7页
目录第7-9页
第一章 引言第9-14页
   ·课题研究的背景和意义第9页
   ·国外研究状况第9-11页
   ·国内研究状况第11-12页
   ·主要工作与本文的结构第12-14页
第二章 文本自动分类的相关模型第14-25页
   ·文本自动分类的定义第14-15页
   ·分类常用模型第15-19页
     ·向量空间模型(VSM,Vector Space Model)第15-16页
     ·潜在语义索引(LSI)模型第16-19页
     ·贝叶斯概率模型第19页
   ·自动分类常用算法介绍第19-25页
     ·中心向量法第19-20页
     ·朴素贝叶斯方法(Naive Bayes)第20-21页
     ·K-近邻算法(KNN)第21页
     ·支持向量机(SVM)第21-25页
第三章 文本自动分类器构造第25-35页
   ·文本预处理第25页
   ·文本特征描述第25-28页
     ·特征提取第25-28页
     ·特征重构第28页
   ·分类器构造第28-34页
     ·训练文本特征项权重计算第29页
     ·待分类文本特征项权重计算第29-30页
     ·分类器构造算法第30-34页
   ·阈值的确定第34-35页
   ·文本自动分类系统的结构框架第35页
第四章 实验设置与结果分析第35-47页
   ·实验用语料库第36-37页
     ·国家语委现代汉语平衡语料库第36页
     ·新浪网网页语料第36-37页
   ·实验环境第37页
   ·实验评测标准第37-38页
   ·实验项目第38页
   ·实验结果分析第38-45页
   ·网页自动分类实验第45-47页
第五章 分类器算法的改进第47-51页
   ·改进算法第47-49页
   ·实验结果分析第49-51页
第六章 结论与展望第51-53页
   ·全文总结第51-52页
   ·展望第52-53页
致谢第53-54页
硕士阶段参加的课题与发表的论文第54-55页
参考文献第55-60页

论文共60页,点击 下载论文
上一篇:可生物降解聚酰胺酸酐和聚酯酸酐的合成及性能研究
下一篇:气液混合两相体放电发射光谱研究