首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文文本分类中特征选择算法及分类算法的研究

摘要第1-6页
ABSTRACT第6-11页
第1章 绪论第11-17页
   ·研究背景第11-12页
   ·国内外研究现状第12-15页
     ·特征选择算法的研究现状第12-13页
     ·文本分类算法的研究现状第13-15页
   ·主要工作和预期目标第15-16页
   ·论文结构第16-17页
第2章 预处理中分词算法的研究第17-25页
   ·中文文本分类预处理分析第17-18页
     ·中文文本分类特点的剖析第17页
     ·中文文本向量空间模型表示法第17-18页
   ·中文分词内容第18-19页
   ·剖析两种机械分词算法第19页
   ·改进的分词算法第19-23页
     ·算法的词典结构第20页
     ·算法匹配方式第20-21页
     ·算法对歧义词的处理策略第21-22页
     ·算法识别未登录词的策略第22-23页
   ·去停用词处理第23-24页
   ·本章小结第24-25页
第3章 文本分类中特征选择算法的研究第25-35页
   ·特征选择算法分析第25-29页
     ·文档频度第25页
     ·互信息第25-27页
     ·信息增益第27-28页
     ·卡方检验第28-29页
   ·绝对比例区分算法第29-31页
     ·CPD 特征选择算法概述第29-30页
     ·CPD 举例说明第30-31页
   ·改进 CPD 特征选择算法第31-34页
   ·本章小结第34-35页
第4章 改进 KNN 文本分类算法第35-43页
   ·文本分类算法分析第35-37页
     ·类中心向量法第35页
     ·K 近邻算法第35-36页
     ·朴素贝叶斯算法第36-37页
   ·传统 KNN 分类算法第37-38页
     ·文本的表示方法第37页
     ·KNN 分类算法第37-38页
   ·改进 KNN 分类算法第38-41页
     ·Rocchio 方法的使用第38-39页
     ·改进KNN 算法第39-41页
   ·本章小结第41-43页
第5章 中文文本分类实验方案与结果分析第43-63页
   ·实验数据集第43-44页
   ·实验评价指标第44-46页
     ·查准率和查全率第44-45页
     ·F-测量第45页
     ·宏平均和微平均第45-46页
   ·实验方案的设计第46-50页
   ·实验结果分析第50-62页
     ·中文文本分类语料库--TanCorpV1.0 上的实验第50-56页
     ·搜狐互联网网页语料库上的实验第56-62页
   ·本章小结第62-63页
结论第63-65页
参考文献第65-69页
攻读硕士学位期间承担的科研任务与主要成果第69-70页
致谢第70-71页
作者简介第71页

论文共71页,点击 下载论文
上一篇:外包数据库模型中文本数据完整性检测方案的研究
下一篇:用特征参数实现构件内部裂纹缺陷的三维重建技术研究