首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于层次分类和集成学习的文本分类技术研究

摘要第1-3页
Abstract第3-7页
第一章 引言第7-10页
   ·研究背景和研究意义第7-8页
   ·本文研究内容第8-9页
   ·本文组织第9-10页
第二章 文本分类概述第10-28页
   ·文本分类的定义第10页
   ·文本分类系统的组成第10-12页
   ·文本预处理第12-14页
     ·去除文档中的格式标记第12页
     ·过滤非法字符和字母大小写转换第12页
     ·去除停用词和稀有词第12-13页
     ·词干化处理第13页
     ·中文分词处理第13-14页
   ·文档表示第14-17页
     ·布尔权重第15页
     ·词频权重第15-16页
     ·TF_IDF 权重第16页
     ·TFC 权重第16页
     ·ITC 权重第16-17页
     ·熵权重第17页
   ·维数约减第17-20页
     ·文档频数第18页
     ·信息增益第18-19页
     ·互信息第19-20页
     ·χ~2 统计量第20页
   ·经典文本分类算法第20-26页
     ·KNN 分类算法第20-21页
     ·Rocchio 算法第21页
     ·Naive Bayes 算法第21-22页
     ·决策树算法第22-23页
     ·神经网络第23页
     ·支持向量机第23-26页
   ·评价方法第26-28页
第三章 层次文本分类技术第28-44页
   ·引言第28-29页
   ·层次学习概述第29-31页
     ·概念第29页
     ·多层次的分类体系第29-30页
     ·层次分类与平坦分类的比较第30-31页
   ·层次学习算法第31-34页
     ·层次特征选择第31-32页
     ·改进的层次分类算法第32-34页
   ·实验设计和实验结果第34-43页
     ·文档集第34-35页
     ·实验设计第35-36页
     ·结果分析第36-43页
   ·小结第43-44页
第四章 集成学习的文本分类模型研究第44-60页
   ·集成分类器介绍第44-46页
     ·集成分类器集成研究的产生和现状第44页
     ·分类器输出信息描述第44-45页
     ·多分类器集成类型第45-46页
   ·集成学习的理论背景第46-49页
     ·随机森林的收敛性[45]第46-47页
     ·集成分类器的分类强度和相关性第47-49页
   ·基于集成学习的文本分类算法第49-54页
     ·个体分类器的生成第49-50页
     ·个体分类器的选择第50-53页
     ·集成分类器算法第53-54页
   ·实验设计和实验结果第54-59页
     ·实验设计第54-55页
     ·实验结果与分析第55-57页
     ·个体选择实验第57-59页
   ·小结第59-60页
第五章 总结和展望第60-62页
   ·总结第60-61页
   ·未来工作第61-62页
参考文献第62-64页
致谢第64-65页
个人简历第65-66页

论文共66页,点击 下载论文
上一篇:漫长且有希望的突围--从波西亚到凯特看英国文学中女性在社会上的主体地位的嬗变
下一篇:航运企业客户关系营销研究