首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文文本分类核心技术研究

摘要第1-5页
Abstract第5-9页
第一章 前言第9-17页
   ·引言第9页
   ·数据挖掘简介第9-13页
     ·数据挖掘的定义第9-10页
     ·数据挖掘的发展及研究现状第10-11页
     ·数据挖掘的流程第11页
     ·数据挖掘的基本任务第11-12页
     ·数据挖掘的应用第12-13页
   ·文本分类简介第13-15页
     ·文本分类的定义第13页
     ·文本分类的流程第13-14页
     ·文本分类的发展及研究现状第14-15页
     ·文本分类的应用第15页
   ·本文的研究内容及组织结构第15-17页
第二章 中文文本分词的研究第17-23页
   ·引言第17页
   ·问题描述第17-18页
   ·基本思想第18页
   ·新的组合型歧义消解算法第18-20页
     ·相关概念第18-19页
     ·算法设计原理第19-20页
     ·算法实现第20页
   ·实验及结果分析第20-22页
   ·本章小结第22-23页
第三章 常用的文本特征选择方法及改进第23-33页
   ·引言第23-24页
   ·常用的特征选择方法第24-26页
     ·TF-IDF(Term Frequency/Inverse Document Frequency)第24页
     ·互信息(MI)第24页
     ·信息增益(IG)第24-25页
     ·期望交义熵(CE)第25页
     ·文本证据权(WET)第25页
     ·优势率(OR)第25页
     ·类别区分词(CDW)第25-26页
   ·多种特征选择算法的组合第26-27页
   ·TF-IDF特征选择方法的改进第27-29页
     ·TF-IDF的不足第27-28页
     ·改进的思想第28页
     ·两点改进第28-29页
   ·互信息特征选择方法(MI)的改进第29页
     ·互信息特征选择方法(MI)存在的问题第29页
     ·互信息特征选择方法(MI)的改进思想第29页
   ·实验结果与分析第29-31页
   ·本章小结第31-33页
第四章 文本分类算法的研究第33-43页
   ·引言第33页
   ·相关概念和理论基础第33-34页
     ·齐性卡方(CHI)假设检验第33-34页
     ·随机事件的独立度第34页
     ·软集合相关定义第34页
   ·基于DHCHI与EIBA的混合特征选择算法第34-36页
     ·DHCHI(Distributed Homogeneous CHI)特征选择方法第34-35页
     ·EIBA(Event IndependenceBased Approach)特征选择方法第35页
     ·混合(EIBA+DHCHI)特征选择算法第35-36页
   ·改进的基于软集合的文本分类方法第36-37页
     ·文本的软集合表示第36页
     ·构造软集合(F,E)的对照表第36-37页
     ·新的基于软集合理论的文本分类算法第37页
   ·基于KNN的文本分类算法第37-38页
   ·朴素贝叶斯(Naive Bayes)文本分类算法第38-40页
   ·实验及结果分析第40-41页
   ·本章小节第41-43页
第五章 总结和展望第43-44页
   ·全文总结第43页
   ·工作展望第43-44页
参考文献第44-47页
攻读硕士学位期间发表的学术论文第47页
读研期间参与科研项目情况第47-48页
致谢第48-49页

论文共49页,点击 下载论文
上一篇:TCP Vegas拥塞控制算法研究
下一篇:Web文本聚类与分类算法研究