首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

搜索引擎中网页净化与消重技术研究

摘要第1-6页
ABSTRACT第6-9页
第一章 绪论第9-13页
   ·课题背景第9-10页
   ·课题提出及意义第10-11页
   ·本文的研究内容第11-12页
   ·本文的组织结构第12-13页
第二章 相关工作第13-25页
   ·网页净化与消重第13-15页
     ·网页噪音第13-14页
     ·网页重复第14-15页
   ·网页净化技术第15-20页
     ·单一页面网页净化第16-18页
     ·同一模板网页净化第18-20页
   ·网页消重技术第20-24页
     ·完全重复网页消重第20-22页
     ·近似重复网页消重第22-24页
   ·本章小结第24-25页
第三章 基于树编辑距离的网页净化第25-45页
   ·树编辑距离第25-29页
   ·网页净化方法第29-38页
     ·网页预处理第30-31页
     ·标签树构建第31-33页
     ·模板生成与去除第33-38页
   ·实验第38-44页
     ·评测标准第38-39页
     ·实验设置第39页
     ·实验结果与分析第39-44页
   ·本章小结第44-45页
第四章 基于信息指纹的网页消重第45-61页
   ·网页消重方法第45-55页
     ·网页特征抽取第46-49页
     ·信息指纹生成第49-52页
     ·重复网页判定第52-55页
   ·实验第55-60页
     ·评测标准第55-56页
     ·实验设置第56-57页
     ·实验结果与分析第57-60页
   ·本章小结第60-61页
第五章 总结与展望第61-63页
   ·总结第61-62页
   ·展望第62-63页
参考文献第63-67页
致谢第67页

论文共67页,点击 下载论文
上一篇:基于Web Services的ADSM的研究及其在网页内容认证中的应用
下一篇:基于DOM树的Deep Web实体抽取的研究与实现