首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文文本自动分类中的关键问题研究

摘  要第1-5页
Abstract第5-10页
第一章 引  言第10-40页
   ·研究的目的、意义及研究背景第10-11页
   ·文本分类的发展过程第11-12页
   ·文本分类的定义第12-13页
   ·文本分类的步骤第13-14页
   ·国际研究现状第14-37页
     ·文本标引第14-15页
     ·特征降维第15-22页
     ·权重计算第22-24页
     ·向量规格化第24-26页
     ·分类器第26-33页
     ·评价标准第33-36页
     ·数据集第36-37页
   ·国内研究现状第37-38页
   ·本论文的研究重点第38-40页
第二章 面向中文文本分类的数据集第40-45页
   ·预处理第40-41页
   ·分类体系第41-43页
   ·类型间的距离第43-44页
   ·实验平台第44-45页
第三章 字串特征单位第45-54页
   ·N-gram特征集第46页
   ·多项式贝叶斯分类器第46-48页
   ·实验设计第48页
   ·实验结果及分析第48-52页
   ·本章小结第52-54页
第四章 特征降维第54-87页
   ·特征对分类的作用第54-56页
   ·- 特征选择第56-66页
     ·与 统计量第56-57页
     ·统计量第57-60页
     ·统计量第60-61页
     ·实验设计第61-63页
     ·实验结果及分析第63-66页
     ·结论第66页
   ·提升高度重叠的Bigrams到相应的Trigrams第66-74页
     ·重叠的Bigrams第66-67页
     ·高度重叠的Bigrams第67-71页
     ·实验设计第71页
     ·实验结果及分析第71-73页
     ·结论第73-74页
   ·删除高度偏差的Bigrams第74-82页
     ·偏差的Bigrams第74-77页
     ·高度偏差的Bigrams第77-79页
     ·实验设计第79页
     ·实验结果及分析第79-81页
     ·结论第81-82页
   ·多步降维策略第82-84页
     ·多步降维算法第82-83页
     ·实验结果及分析第83-84页
   ·本章小结第84-87页
第五章 特征权重计算第87-107页
   ·数值权重第87-95页
     ·权重第88-90页
     ·TF*EXP*CIG权重第90-91页
     ·实验设计第91页
     ·实验结果及分析第91-94页
     ·结论第94-95页
   ·Binary权重+数值权重平滑第95-104页
     ·Binary权重第97-98页
     ·Binary权重+数值权重平滑第98-99页
     ·实验设计第99页
     ·实验结果及分析第99-103页
     ·结论第103-104页
   ·本章小结第104-107页
第六章 Bigram特征与词特征的比较第107-117页
   ·正向最大匹配分词第107-109页
   ·实验设计第109页
   ·实验结果及分析第109-115页
   ·本章小结第115-117页
第七章 中文文本分类总体模型第117-122页
   ·总体模型第117-119页
   ·分类结果第119-122页
结  论第122-126页
参考文献第126-137页
致  谢第137页
声明第137-138页
附录A 基准模型中类型间的相似度第138-144页
附录B 总体模型中类型间的相似度第144-151页
个人简历、在学期间的研究成果及发表的学术论文第151-152页

论文共152页,点击 下载论文
上一篇:RESISTIN基因外显子及部分内含子单核苷酸多态性与2型糖尿病的关联研究
下一篇:高维数据的特征选择及基于特征选择的集成学习研究