首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文文本自动分类研究与应用

摘要第1-6页
Abstract第6-10页
1 绪论第10-17页
   ·课题背景及意义第10页
   ·文本分类系统的研究现状第10-13页
   ·文本分类系统的问题描述第13-14页
     ·系统任务第13页
     ·评价方式第13-14页
   ·本文的研究内容与研究方法第14-15页
   ·本文的内容安排第15-17页
2 中文文本自动分类的技术介绍第17-26页
   ·文本分类的相关定义第17页
   ·文本分类的两种类型第17-18页
   ·机器学习方法第18页
   ·向量空间模型第18-21页
     ·项权重第19页
     ·向量间相似度度量第19-20页
     ·向量空间模型的优势第20-21页
   ·中文自动分词第21-26页
     ·基于知识的分词方法第21页
     ·基于统计的分词方法第21-22页
     ·基于词典匹配的分词方法第22-23页
     ·消除歧义第23-24页
     ·未登录词第24-26页
3 文本分类的关键技术第26-33页
   ·项的权重第26-27页
   ·特征选择第27-29页
     ·DF第27页
     ·IG信息增益第27-28页
     ·MI互信息第28-29页
     ·χ~2统计量(也叫CHI)第29页
   ·常用分类算法第29-30页
     ·文本分类模型第29-30页
     ·几种分类算法的研究第30页
   ·文本分类的评估指标第30-32页
   ·本章小结第32-33页
4 中文文本自动分类系统的设计与实现第33-55页
   ·系统简介第33-34页
   ·中文自动分词第34-38页
     ·本系统的分词工具第34-35页
     ·分词词典第35-37页
     ·分词算法第37-38页
     ·分词算法的切分效果示例第38页
   ·文本信息统计模块第38-42页
     ·文本信息统计模块的意义第39页
     ·文本信息统计模块中的类结构第39-41页
     ·文本信息统计模块的工作流程第41-42页
   ·特征选择第42-46页
     ·传统的MI第42页
     ·改进的MI第42-43页
     ·传统的组合特征选择第43-45页
     ·改进的组合特征提取第45-46页
   ·特征权重计算第46-47页
     ·传统的TFIDF权重第46-47页
   ·分类算法第47-52页
     ·传统的KNN算法第47-48页
     ·KNN算法的特点第48-49页
     ·改进的KNN算法第49-52页
   ·评价方式第52-53页
   ·本章小结第53-55页
5 实验及分析第55-71页
   ·实验所用语料集第55-56页
   ·改进的MI特征选择算法第56-58页
   ·改进的组合特征选择算法效果第58-61页
   ·改进的KNN算法分类效果第61-66页
   ·各模块改进算法组合效果第66-71页
6 总结与展望第71-73页
   ·总结第71-72页
   ·展望第72-73页
参考文献第73-78页
致谢第78页

论文共78页,点击 下载论文
上一篇:决策树分类算法及其在高校学生就业中的应用研究
下一篇:基于层次分析法的信息系统应用效果评估模型研究及应用