首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于代表样本的中文网页分类研究

摘要第1-10页
ABSTRACT第10-12页
第1章 绪论第12-18页
   ·课题的研究背景及意义第12-13页
   ·国内外研究现状第13-16页
     ·自动分类技术的发展趋势第13-14页
     ·分类模型和分类算法的发展现状第14-15页
     ·基于网页特性的分类研究现状第15-16页
   ·课题研究的主要内容第16-17页
   ·论文的组织结构第17-18页
第2章 中文网页分类关键技术第18-35页
   ·文本分类技术概述第18-20页
     ·文本分类概念第18页
     ·自动分类的方法第18-19页
     ·网页分类过程第19-20页
   ·网页预处理第20-23页
     ·HTML文档解析第20-21页
     ·中文分词第21-22页
     ·停用词删除第22页
     ·词性选择第22-23页
   ·文本表示第23-25页
     ·向量空间模型第23-24页
     ·权重计算第24-25页
   ·特征选取技术第25-27页
     ·文档频率(DF)第26页
     ·信息增益(IG)第26页
     ·开方拟合检验(x2-CHI)第26-27页
     ·互信息法(MI)第27页
   ·分类算法简介第27-31页
     ·简单距离向量法第28页
     ·朴素贝叶斯(Naive-Bayes)第28-29页
     ·支持向量机方法(SVM)第29-31页
     ·最近邻居算法(NN)第31页
   ·文本分类效果评价指标第31-33页
   ·网页分类在搜索引擎中的应用第33-34页
   ·本章小结第34-35页
第3章 基于代表样本的KNN算法研究第35-45页
   ·KNN算法第35-37页
     ·算法描述第35-36页
     ·算法分析第36页
     ·相关研究工作第36-37页
   ·代表样本生成新策略第37-42页
     ·代表样本概念的提出第37-38页
     ·一种新的代表样本生成策略第38-42页
   ·改进算法描述第42-43页
     ·训练算法第42页
     ·分类算法第42-43页
   ·基于代表样本生成策略的KNN分类过程第43页
   ·本章小结第43-45页
第4章 中文网页分类器设计与实现第45-54页
   ·开发与运行平台第45页
   ·处理流程第45页
   ·分类器设计说明第45-50页
     ·系统结构第45-46页
     ·模块功能描述第46-48页
     ·系统类说明第48页
     ·数据集说明第48-49页
     ·网页下分类器CPCK界面第49-50页
   ·实验结果分析第50-54页
     ·代表样本法与传统KNN算法的实验比较第50-52页
     ·代表样本法与其他算法的实验比较第52-54页
第5章 结论第54-56页
   ·主要工作第54页
   ·主要创新点第54-55页
   ·存在的问题及未来的方向第55-56页
参考文献第56-59页
致谢第59-60页
学位论文评阅及答辩情况表第60页

论文共60页,点击 下载论文
上一篇:滨州医学院学校收费管理系统设计与实现
下一篇:高校实验排课管理系统的开发与设计