首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

自动文本分类算法研究

摘要第1-8页
ABSTRACT第8-9页
插图索引第9-10页
附表索引第10-11页
第1章 绪论第11-16页
   ·研究背景第11-12页
   ·文本分类研究进展第12-14页
   ·本文所做的工作第14-15页
   ·本文的内容安排第15-16页
第2章 常用文本分类算法性能研究第16-29页
   ·引言第16页
   ·文本分类模型第16-18页
   ·特征选择方法第18-19页
     ·文档频率第18页
     ·互信息第18页
     ·信息增益第18-19页
     ·X~2统计量第19页
   ·常用文本分类算法研究第19-22页
     ·朴素贝叶斯算法第19-20页
     ·支持向量机算法第20-21页
     ·TFIDF算法第21-22页
     ·k近邻算法第22页
   ·文本分类中常用的标准数据集第22-24页
     ·20 新闻组数据集(20 newsgroups corpus)第22-23页
     ·路透社数据集(Reuters-21578 corpus)第23-24页
   ·文本分类中常用的算法性能评价体系第24-25页
   ·Bow文本分类系统第25-26页
   ·各种算法的性能评价第26-28页
   ·小结第28-29页
第3章 消除朴素贝叶斯算法中零概率问题的新策略第29-38页
   ·引言第29-30页
   ·相关工作第30-33页
     ·朴素贝叶斯文本分类算法第30-31页
     ·最大似然估计与零概率问题第31页
     ·平滑算法第31-33页
   ·消除朴素贝叶斯算法中零概率问题的新策略第33-35页
     ·NB_TF策略第34页
     ·NB_TS策略第34-35页
   ·实验和分析第35-37页
   ·小结第37-38页
第4章 调整训练文本权值改善分类器性能第38-45页
   ·引言第38-39页
   ·相关工作第39-40页
   ·训练文本权值调整策略第40-42页
   ·实验和分析第42-44页
     ·基于20新闻组数据集的实验第42-43页
     ·基于路透社数据集的实验第43-44页
   ·小结第44-45页
第5章 一种改进的TFIDF文本分类算法第45-52页
   ·引言第45-46页
   ·相关工作第46-49页
     ·Rocchio文本分类算法第46页
     ·Rocchio与k-NN相结合的算法第46-49页
   ·一种改进的TFIDF文本分类算法第49-50页
   ·实验及分析第50-51页
     ·基于20新闻组数据集的实验第50-51页
     ·基于路透社数据集的实验第51页
   ·小结第51-52页
结论第52-54页
参考文献第54-59页
致谢第59-60页
附录A 攻读学位期间所发表的学术论文第60页

论文共60页,点击 下载论文
上一篇:分布式系统中主机负载预测
下一篇:一个新的基于CIDF的入侵检测系统的设计与实现