首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于半监督学习的中文文档分类技术研究

第一章 文本分类概述第1-16页
 1.1 文本分类的概念第9-10页
 1.2 文本分类的背景和意义第10页
 1.3 文本分类技术的国内外发展现状第10-12页
 1.4 文本分类技术简介第12-14页
 1.5 本文主要工作内容第14-16页
第二章 文本分类关键技术第16-31页
 2.1 文本特征生成第16-19页
  2.1.1 文本表示第16-17页
  2.1.2 文本特征第17-18页
  2.1.3 分词第18-19页
 2.2 特征选择与降维第19-22页
  2.2.1 特征选择第19-21页
  2.2.2 特征抽取第21-22页
 2.3 权重的计算第22-23页
 2.4 文本分类技术第23-27页
  2.4.1 文本分类模式第23-25页
  2.4.2 常用的文本分类方法第25-27页
 2.5 文本分类技术性能评价第27-31页
  2.5.1 影响文本分类系统评价的因素第27-28页
  2.5.2 评价方法第28-30页
  2.5.3 影响文本分类的因素第30-31页
第三章 聚类分析第31-36页
 3.1 相似性度量第31-32页
 3.2 主要聚类方法的分类第32-33页
 3.3 类的定义第33-34页
 3.4 K-平均方法第34-36页
第四章 基于聚类的半监督学习第36-52页
 4.1 半监督学习第36-38页
 4.2 直推式支持向量机第38-47页
  4.2.1 统计学习理论第38-39页
  4.2.2 支持向量机第39-43页
  4.2.3 直推式支持向量机第43-47页
 4.3 基于聚类的半监督学习第47-52页
  4.3.1 基于聚类的半监督学习意义第47-49页
  4.3.2 基于聚类的半监督学习第49-52页
第五章 系统设计与实现第52-60页
 5.1 系统的结构设计第52页
 5.2 系统具体实现第52-56页
  5.2.1 数据源第52-53页
  5.2.2 网页格式处理第53-54页
  5.2.3 分词第54页
  5.2.4 特征选择和权重计算第54-56页
  5.2.5 算法实现第56页
 5.3 文本分类及性能测试第56-60页
  5.3.1 有监督学习性能测试第56-57页
  5.3.2 半监督学习性能测试第57-58页
  5.3.3 参数分析第58-60页
第六章 全文总结第60-62页
 6.1 全文总结第60-61页
 6.2 下一步工作及展望第61-62页
参考文献第62-66页
致谢第66-67页
攻读硕士学位期间公开发表的文章第67页

论文共67页,点击 下载论文
上一篇:试论激励中如何贯彻以人为本的理念
下一篇:欧盟统一商标制度及其对我国的启示