首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

结合仿射空间和正交分解的类中心分类法研究

摘要第1-4页
ABSTRACT第4-9页
1 绪论第9-14页
   ·本文的研究背景及其现实意义第9页
   ·文本分类研究和应用现状第9-11页
   ·仿射坐标系研究与应用现状第11页
   ·正交分解方法应用和研究现状第11-12页
   ·本文结构和研究内容第12-14页
     ·本文的主要工作第12页
     ·本文的组织第12-14页
2 文本分类相关技术第14-24页
   ·文本分类系统的问题描述第14-15页
   ·文本分类系统流程及需解决的问题第15-16页
   ·文本信息检索模型第16-18页
     ·布尔模型(Boolean Model)第16页
     ·概率模型(Probabilistic Model)第16页
     ·向量空间模型第16-18页
   ·中文分词技术第18页
   ·常用特征项提取方法第18-20页
     ·文档频率 DF(Document Frequency:DF)第18-19页
     ·信息增益方法 I G(Information Gain: IG)第19页
     ·互信息方法 MI(Mutual Information: MI)第19-20页
   ·常用分类方法第20-21页
     ·类中心分类法第20-21页
     ·K 最邻近方法KNN第21页
   ·分类器评价标准第21-23页
     ·精确度和召回率第22页
     ·F-测量第22页
     ·分类方法的综合评价第22-23页
   ·本章小结第23-24页
3 仿射空间和正交分解概念第24-29页
   ·仿射坐标系第24-25页
   ·仿射坐标系下向量的性质第25页
   ·正交分解法第25-27页
     ·力的正交分解第25-26页
     ·正交分解模型应用到文本分类第26-27页
   ·线形变换第27-28页
   ·本章小结第28-29页
4 类中心分类法的改进第29-35页
   ·传统向量空间内类中心分类法的不足第29-31页
   ·基于仿射空间和正交分解模型的类中心分类法的改进第31-34页
     ·基于正交分解的类中心分类法第31-32页
     ·基于仿射空间和正交分解的类中心分类法Ⅰ第32-33页
     ·基于仿射空间和正交分解的类中心分类法Ⅱ第33-34页
   ·本章小结第34-35页
5 实验方法与结果分析第35-47页
   ·数据来源第35页
   ·语料库1 文本分类实验第35-45页
     ·混淆矩阵第36-39页
     ·特征选择个数的选取第39页
     ·总体查全率、查对率第39-42页
     ·各个类的查全率、查对率第42-44页
     ·各中方法时间对比第44-45页
   ·语料库2 文本分类实验第45-46页
     ·总体查全率、查对率第45-46页
   ·本章小结第46-47页
6 结论与展望第47-48页
   ·本文的工作总结第47页
   ·进一步的工作第47-48页
致谢第48-49页
参考文献第49-51页
附录第51页
 A. 作者在攻读硕士学位期间发表的论文第51页
 B. 作者在攻读硕士学位期间参与的项目第51页

论文共51页,点击 下载论文
上一篇:电力系统中分布式异构数据集成的研究与实现
下一篇:语义驱动的XML规范化研究