首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文文本分类研究

摘要第1-5页
Abstract第5-10页
第1章 绪论第10-15页
   ·研究背景及意义第10页
   ·研究现状第10-13页
     ·国外研究现状第10-12页
     ·国内研究现状第12页
     ·当前研究重点第12-13页
   ·本文的主要研究工作第13页
   ·本文的组织第13-15页
第2章 中文文本分类的相关理论和技术第15-31页
   ·文本分类基本概念第15-16页
   ·文本预处理第16-21页
     ·去除格式标记第17页
     ·过滤非法字符和字母大小写转换第17页
     ·去除停用词、稀有词和词干化第17-18页
     ·中文分词和词性标注第18-21页
       ·中文分词第18-19页
       ·中文词性标注第19-21页
   ·特征选取第21-24页
     ·文本频率第22页
     ·互信息第22页
     ·信息增益第22-23页
     ·χ~2统计第23-24页
   ·文本表示方法第24-25页
     ·布尔模型第24页
     ·向量空间模型第24-25页
     ·概率模型第25页
   ·文本分类方法第25-30页
     ·朴素贝叶斯方法第25-26页
     ·k-近邻方法第26-27页
     ·支持向量机方法第27页
     ·决策树方法第27-28页
     ·神经网络方法第28-29页
     ·相似度方法第29-30页
   ·分类算法评估第30-31页
第3章 基于类别核心词的朴素贝叶斯分类方法第31-38页
   ·朴素贝叶斯分类方法的优缺点第31-32页
   ·基于类别核心词的朴素贝叶斯分类第32-34页
     ·文本分词及类别核心词选取第32页
     ·类别核心词的处理第32-33页
     ·类别核心词在朴素贝叶斯分类方法中的应用第33-34页
     ·阈值的设置第34页
   ·实验结果及分析第34-36页
     ·实验数据第34-35页
     ·实验结果第35-36页
     ·实验分析第36页
   ·本章小结第36-38页
第4章 基于概念的中文文本分类方法第38-52页
   ·知网简介第38-46页
     ·知网概念第38-39页
     ·义原第39页
     ·知网系统的概貌第39-41页
     ·知识词典描述语言第41-46页
       ·总规定第41-42页
       ·KDML中特定的标识符第42页
       ·事件类概念的描述方法第42-43页
       ·实体类概念的描述方法第43-44页
       ·属性类概念的描述方法第44-45页
       ·属性值类概念的描述方法第45页
       ·各种动态角色的使用第45-46页
   ·文本预处理第46-47页
     ·文本分词与词性标注第46页
     ·特征选取第46页
     ·类别核心词的选取与处理第46-47页
   ·概念映射方法第47-48页
   ·实验结果及分析第48-51页
     ·实验数据第48-49页
     ·实验结果及分析第49-51页
   ·本章小结第51-52页
第5章 结论与展望第52-54页
   ·结论第52-53页
   ·展望第53-54页
参考文献第54-58页
攻读硕士学位期间发表论文情况第58-59页
致谢第59页

论文共73页,点击 下载论文
上一篇:跨国公司供应链管理中的信息共享问题研究
下一篇:燃气锅炉余热回收的理论与应用