首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于类中心化的快速大规模文本层次分类问题研究

摘要第1-6页
Abstract第6-7页
引言第7-9页
第一章 基本概念和相关工作第9-17页
   ·单标签的分类器算法第9-11页
   ·多标签的分类器算法第11-12页
   ·大规模类标签文本分类问题第12-17页
     ·LSHTC1单标签数据介绍第12-13页
     ·LSHTC2多标签数据介绍第13-14页
     ·大规模多标签文本分类问题概述第14-17页
第二章 类中心化统计学习方法第17-26页
   ·统计类中心方法的近似解释第17-18页
     ·退化的线性分类器第17-18页
     ·基于聚类方式的推广近似第18页
   ·特征提取方式第18-20页
     ·第一类特征提取方式第19页
     ·第二类特征提取方式第19页
     ·结合第一第二类的特征提取方式第19-20页
   ·IDF特征的归入以及多类特征结合统计的方式第20-22页
     ·加入IDF统计特征第20-21页
     ·两类特征结合方式第21-22页
   ·层次化的类中心方法第22-26页
第三章 类中心的多类标签统计方法第26-31页
   ·类中心算法扩展方法第26-27页
   ·多类标签的标签扩展算法第27-28页
   ·多类标签的排序预测算法第28-31页
     ·相似度值的排序第28-29页
     ·最佳n原则排序第29页
     ·混合排序方法第29-31页
第四章 实验第31-50页
   ·实验数据以及实验环境介绍第31-33页
     ·数据预处理第31-32页
     ·数据特征介绍第32页
     ·实验环境介绍第32-33页
   ·评测指标简介第33-37页
     ·单一类标签的评价指标第33-35页
     ·多类标签的评价指标第35-37页
   ·单一类标签实验结果及实验分析第37-46页
     ·评测测试结果第37-41页
     ·不同特征提取方式的结果比较第41页
     ·两类特征的结合比较第41-42页
     ·独立特征分布权重计入第42-43页
     ·训练测试时间与空间消耗比较第43-44页
     ·层次信息加入推理的时间消耗比较第44-46页
   ·多类标签实验结果及实验分析第46-49页
     ·不同排序算法结果比较第46页
     ·排序算法参数调整实验第46-47页
     ·多类标签具体实验结果第47-49页
   ·实验总结第49-50页
第五章 总结第50-51页
参考文献第51-54页
论文发表情况第54-55页
致谢第55-56页

论文共56页,点击 下载论文
上一篇:基于FPGA的视频接口芯片测试系统的研究与设计
下一篇:基于BPM的数据中心业务运营支撑系统研究与实现