首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于决策树和贝叶斯算法的垃圾网页检测的研究和实现

摘要第1-5页
Abstract第5-9页
第1章 绪论第9-15页
   ·课题背景第9-12页
     ·垃圾网页的定义第9-10页
     ·垃圾网页检测算法的研究现状第10-11页
     ·网页过滤技术的主要方向第11-12页
   ·本课题的目的和意义第12-13页
   ·本文主要工作第13-14页
   ·本文的组织结构第14-15页
第2章 获取垃圾网页特征的相关知识及技术第15-27页
   ·搜索引擎排序算法第15-18页
     ·向量空间模型(VSM)第16-17页
     ·PageRank模型第17-18页
   ·特征向量的降维第18-22页
     ·改进的χ2统计量和模式聚合的文本降维原理第19页
     ·改进χ2统计量和模式聚合的文本降维流程第19-21页
     ·改进χ2统计量和模式聚合的实例测试分析第21-22页
   ·分词技术分析第22-25页
     ·基于内容匹配的中文分词方法第22-24页
     ·基于统计的中文分词方法第24-25页
   ·本章小结第25-27页
第3章 基于决策树的搜索引擎垃圾网页检测技术第27-43页
   ·决策树的基本思想第27-28页
   ·ID3 算法第28-31页
     ·ID3 算法基本原理第28-29页
     ·ID3 算法的优缺点分析第29-31页
   ·搜索引擎垃圾网页作弊技术分析第31-32页
   ·一种改进的ID3 算法第32-39页
     ·ID3 算法主要改进思想第32-35页
     ·搜索引擎垃圾网页特征向量的选取第35-39页
   ·实例分析第39-42页
   ·本章小结第42-43页
第4章 基于贝叶斯的不良信息垃圾网页检测技术第43-57页
   ·贝叶斯分类第43-47页
     ·贝叶斯公式第43-45页
     ·一般贝叶斯分类器第45-46页
     ·朴素贝叶斯分类器第46-47页
   ·几种改进的朴素贝叶斯分类器第47-50页
     ·树扩展的朴素贝叶斯分类器(TAN)第47-48页
     ·隐藏扩展的朴素贝叶斯分类器(HAN)第48-49页
     ·属性选择的朴素贝叶斯分类器(ASN)第49-50页
   ·一种基于改进χ2统计的ASN方法第50-54页
     ·改进ASN方法的基本思想第51-52页
     ·基于改进χ2统计的ASN方法的实现流程第52-54页
   ·不良信息垃圾网页的具体检测策略第54-56页
     ·基于改进ASN方法的学习阶段第54-55页
     ·基于改进ASN方法的分类阶段第55-56页
   ·本章小结第56-57页
第5章 整合两种算法的检测系统的实现第57-67页
   ·系统总体设计第57页
   ·决策树模块的设计与实现第57-59页
   ·贝叶斯模块的设计与实现第59-62页
   ·数据库的设计第62-63页
   ·分词模块的实现第63-66页
   ·反馈学习及查重模块第66页
   ·本章小结第66-67页
第6章 实验及结果分析第67-73页
   ·实验环境第67页
   ·决策树模块的实验分析第67-70页
     ·数据采集第67-68页
     ·实验及结果比较第68-70页
   ·样本数量和阈值对贝叶斯算法的影响第70-71页
   ·系统运行速度测试第71页
   ·本章小结第71-73页
结论第73-75页
参考文献第75-79页
攻读硕士学位期间所发表的学术论文第79-81页
致谢第81页

论文共81页,点击 下载论文
上一篇:中国水墨画元素的动态形式在网站设计中的应用
下一篇:基于UML的Web应用测试方法的研究与应用