首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

文本分类中特征提取和特征加权方法研究

中文摘要第1-5页
英文摘要第5-9页
1 绪论第9-13页
   ·研究背景及意义第9-10页
   ·国内外研究现状第10-11页
   ·本文的结构和研究内容第11-13页
     ·本文的研究内容第11页
     ·本文的组织第11-13页
2 文本分类相关技术第13-30页
   ·文本分类的定义第13-14页
   ·文本表示模型第14-16页
   ·文本分类流程第16-17页
   ·文本预处理第17-20页
     ·分词技术第17-19页
     ·去除停用词第19-20页
   ·特征降维第20-21页
     ·局部降维和全局降维第20页
     ·特征抽取和特征提取第20-21页
   ·特征加权第21-22页
   ·文本分类方法第22-26页
     ·朴素贝叶斯算法第22-23页
     ·Rocchio 算法第23-24页
     ·K-最近邻算法第24-25页
     ·支持向量机第25-26页
   ·分类系统的评估第26-28页
     ·评估方法第26-27页
     ·评估指标第27-28页
   ·本章小结第28-30页
3 基于集中度、分散度和频度的特征提取方法第30-38页
   ·特征提取的过程第30-31页
   ·常用的特征提取方法第31-34页
     ·文档频数(Document Frequency,DF)第31页
     ·互信息(Mutual Information,MI)第31-32页
     ·信息增益(Information Gain,IG)第32-33页
     ·期望交叉熵(Expected Cross Entropy,CE)第33页
     ·χ~2 统计量(Chi-square Statistic,CHI)第33-34页
     ·文本证据权(Weight of Evidence for Text,WET)第34页
   ·CDF 特征提取方法第34-37页
   ·本章小结第37-38页
4 结合集中度和分散度改进的 TF-IDF 方法第38-44页
   ·TF-IDF 方法的提出第38-39页
   ·TF-IDF 方法的不足第39-40页
   ·结合集中度、分散度改进的TF-IDF 方法第40-43页
   ·本章小结第43-44页
5 实验方法和结果分析第44-61页
   ·中文文本分类系统的实现第44-47页
   ·实验结果及其分析第47-60页
     ·实验介绍第47页
     ·数据集第47页
     ·特征提取方法对比实验第47-53页
     ·特征加权方法对比实验第53-60页
   ·本章小结第60-61页
6 结论与展望第61-63页
   ·研究总结第61页
   ·下一步的工作第61-63页
致谢第63-64页
参考文献第64-67页
附录第67页
 A 作者在攻读硕士学位期间发表的论文第67页
 B 作者在攻读硕士学位期间参与的项目第67页

论文共67页,点击 下载论文
上一篇:红外与可见光图像融合的研究
下一篇:元胞自动机在图像并行加密中的应用研究