首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

搜索引擎中网页分类和网页净化的研究与实现

摘要第1-5页
Abstract第5-9页
第1章 绪论第9-16页
   ·课题背景及研究意义第9-10页
   ·国内外研究现状第10-14页
     ·传统网页分类方法第10-12页
     ·传统网页去噪技术第12-14页
   ·论文的提出第14页
   ·课题研究内容以及组织结构第14-15页
     ·研究内容第14-15页
     ·组织结构第15页
   ·本章小结第15-16页
第2章 基于多特征的网页分类第16-35页
   ·WEB网页的结构和处理方法第16-18页
     ·WEB网页的结构特点第16-17页
     ·DOM树第17-18页
   ·WEB网页分类和特点分析第18-22页
     ·目录型网页第18-20页
     ·主题型网页第20-22页
     ·图片型网页第22页
   ·基于多特征的网页分类第22-31页
     ·主题特征的发现第22-26页
     ·主题特征的量化第26-29页
     ·网页分类算法的设计第29-31页
   ·基于多特征的网页分类的实现第31-33页
     ·实验环境第31页
     ·开源类库的使用第31-32页
     ·基于多特征网页分类算法中函数方法设计第32-33页
   ·实验结果及分析第33-34页
   ·本章小结第34-35页
第3章 基于分块的网页净化第35-45页
   ·网页净化综述第35-36页
   ·网页分块的构建第36-37页
   ·基于分块的网页净化算法的设计第37-41页
   ·基于分块的网页净化算法的实现第41页
   ·实验结果及分析第41-44页
   ·本章小结第44-45页
第4章 基于文本相似性比较的网页净化第45-54页
   ·文本相似度比较方法的选取第45-47页
     ·向量空间模型第45-46页
     ·字符串相似度第46页
     ·向量空间模型的选取第46-47页
   ·关键词权值的选取第47-48页
   ·基于文本间相似度的网页净化算法的设计第48-49页
   ·基于文本间相似度的网页净化算法的实现第49-51页
   ·实验结果与分析第51-52页
   ·本章小结第52-54页
第5章 总结与展望第54-56页
   ·总结第54-55页
   ·展望第55-56页
致谢第56-57页
参考文献第57-59页

论文共59页,点击 下载论文
上一篇:基于海量数据的实时查询处理
下一篇:基于Hadoop的作业调度算法的研究和改进