首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于团结构的文本分类技术研究

摘要第1-5页
Abstract第5-8页
第一章 引言第8-12页
   ·研究背景第8-9页
   ·本文工作第9-10页
   ·论文组织第10-12页
第二章 文本分类概述第12-32页
   ·文本分类的基本概念第12-14页
     ·文本分类任务的特点第12-13页
     ·文本分类系统的流程第13-14页
   ·文本预处理第14-17页
     ·去除语料库中的格式标记第14-15页
     ·去除停用词、稀有词和词干化第15页
     ·中文分词第15-17页
   ·文本表示方法第17-19页
     ·布尔权重第17页
     ·词频权重第17-18页
     ·tf-idf 权重第18页
     ·tfc 权重第18页
     ·ltc 权重第18-19页
   ·降维技术第19-26页
     ·特征选择第19-22页
     ·特征提取第22-26页
   ·文本分类算法第26-29页
     ·Rocchio 算法第26-27页
     ·Na(?)ve Bayes 算法第27页
     ·K 近邻分类器第27-28页
     ·决策树算法第28页
     ·支持向量机第28-29页
   ·评价方法第29-32页
第三章 基于文本团的文本分类第32-43页
   ·文本相似图第32页
   ·文本团提取第32-33页
   ·文本类别确定第33-34页
   ·GC 与SVM 组合分类器第34页
   ·试验准备和结果分析第34-43页
     ·语料库第34-36页
     ·预处理第36-37页
     ·试验结果及分析第37-43页
第四章 基于链接信息的文本分类第43-53页
   ·基于内容的相似性度量第43-44页
   ·基于链接的相似性度量第44-45页
   ·内容相似与链接相似组合确定文本类别第45页
   ·试验准备和结果分析第45-53页
     ·语料库第45-46页
     ·数据预处理第46页
     ·试验结果及分析第46-53页
第五章 总结与展望第53-55页
   ·总结第53页
   ·展望第53-55页
参考文献第55-59页
在学期间学术成果情况第59-60页
致谢第60页

论文共60页,点击 下载论文
上一篇:基于ASP.NET和XML的网络考试系统的设计与实现
下一篇:基于ORACLE数据库应用系统性能调整和优化研究