首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于χ~2统计的文本分类特征选择方法研究

摘要第1-6页
Abstract第6-10页
第一章 绪论第10-14页
   ·研究背景和意义第10-11页
   ·国内外研究现状第11-12页
   ·本文所做的工作和组织结构第12-14页
第二章 文本分类相关技术第14-23页
   ·文档预处理第14-15页
   ·文档表示模型第15-16页
     ·布尔模型第15页
     ·向量空间模型第15-16页
     ·概率模型第16页
   ·权重计算第16-18页
   ·维数约简第18-19页
   ·文本分类算法第19-21页
     ·K 近邻第19-20页
     ·决策树第20页
     ·朴素贝叶斯第20-21页
     ·支持向量机第21页
   ·文本分类性能评价指标第21-22页
   ·本章小结第22-23页
第三章 特征选择方法研究第23-34页
   ·特征选择概述第23页
   ·文档频率第23-24页
   ·信息增益第24页
   ·互信息第24-25页
   ·最优正交质心第25-26页
   ·χ~2统计第26-33页
     ·传统χ~2统计方法的缺陷第27-29页
     ·已有χ~2统计改进方法第29页
     ·本文χ~2统计改进方法第29-33页
   ·本章小结第33-34页
第四章 实验与结果分析第34-46页
   ·语料库第34-36页
     ·复旦大学语料库第34-35页
     ·Reuters-21578第35-36页
     ·搜狗语料库第36页
   ·实验设计第36-39页
   ·实验结果与分析第39-45页
   ·本章小结第45-46页
第五章 总结与展望第46-48页
   ·总结第46页
   ·下一步工作展望第46-48页
参考文献第48-51页
附录 1 复旦大学语料库传统χ~2统计部分类别的前 25 个特征第51-54页
附录 2 复旦大学语料库本文χ~2统计改进方法部分类别的前 25 个特征第54-57页
攻读硕士学位期间取得的研究成果第57-58页
致谢第58-59页
附件第59页

论文共59页,点击 下载论文
上一篇:机构信息管理系统的设计与实现
下一篇:企业文档管理系统的设计与实现