首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文网页分类特征提取方法研究

摘要第1-5页
Abstract第5-10页
第一章 前言第10-16页
   ·课题的研究背景及意义第10-11页
   ·国内外研究现状第11-14页
   ·课题研究的主要内容第14-15页
   ·论文的组织结构第15-16页
第二章 中文网页自动分类技术第16-28页
   ·文档自动分类算法定义及分类第16-17页
   ·中文网页自动分类一般过程第17-24页
     ·网页预处理第18-21页
     ·特征提取第21页
     ·分类算法第21-22页
     ·截尾算法第22-23页
     ·结果评价第23-24页
   ·中文网页自动分类算法第24-26页
     ·KNN 分类算法第24-25页
     ·NB分类算法第25页
     ·SVM分类算法第25-26页
     ·各分类算法比较第26页
   ·中文网页自动分类发展方向第26-27页
   ·本章小结第27-28页
第三章 网页特征提取方法第28-35页
   ·网页特征提取的工作原理第28页
   ·常用的网页特征提取方法第28-30页
     ·特征频率(Term Frequency,TF)第28-29页
     ·文档频率(DocumentFrequency,DF)第29页
     ·信息增益(InformationGain,IG)第29-30页
     ·期望交叉熵(ExpectedCrossEntropy,ECE)第30页
     ·特征熵(Term Entropy)第30页
   ·本文研究的特征提取方法第30-32页
     ·互信息(MutualInformation,MI)第30-31页
     ·χ~2统计量(Chi-square,CHI)第31-32页
   ·特征提取的研究和发展方向第32-34页
   ·本章小结第34-35页
第四章 基于互信息、χ~2统计量的改进算法第35-40页
   ·互信息算法的研究与改进第35-38页
     ·互信息算法的分析第35-36页
     ·互信息算法的改进策略第36-37页
     ·改进算法描述第37-38页
   ·χ~2统计量算法的研究与改进第38-39页
     ·χ~2统计量算法的分析第38页
     ·χ~2统计量的改进算法描述第38-39页
   ·本章小结第39-40页
第五章 网页特征的位置加权及预降维第40-46页
   ·网页特征提取对象第40-41页
   ·网页的特征表示第41-43页
   ·网页特征的位置加权方法第43-44页
   ·网页特征的预降维处理第44页
   ·本章小结第44-46页
第六章 基于改进的特征提取方法的实验设计第46-55页
   ·开发工具和平台第46页
   ·实验系统设计第46-50页
     ·系统流程第46页
     ·实验设置第46-47页
     ·具体步骤第47-50页
   ·结果及分析第50-54页
   ·本章小结第54-55页
总结第55-57页
 主要工作第55-56页
 主要创新点第56页
 存在的问题及未来的方向第56-57页
参考文献第57-61页
在学期间的研究成果第61-62页
致谢第62页

论文共62页,点击 下载论文
上一篇:基于线电极和自适应网格的电阻层析成像技术研究
下一篇:基于回归测试模型的用例集的优化研究