首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

面向主题的双约束网页采集方法的研究和实现

摘要第1-6页
ABSTRACT第6-10页
第一章 绪论第10-16页
   ·研究背景及意义第10-11页
   ·国内外研究现状第11-15页
   ·本文内容及组织结构第15-16页
第二章 搜索引擎概述第16-28页
   ·通用搜索引擎第16-22页
     ·通用搜索引擎的工作原理第17-20页
     ·通用搜索引擎的分类第20-22页
   ·主题搜索引擎第22-27页
     ·主题搜索引擎的工作原理第22-26页
     ·主题搜索引擎的区别及优势第26-27页
   ·本章小结第27-28页
第三章 主题特征模型的研究第28-42页
   ·主题特征模型第28-37页
     ·文本表示模型第29-32页
     ·文本特征选取第32-33页
     ·主题分类第33-35页
     ·主题特征模型第35-36页
     ·主题特征模型的建立及更新第36-37页
   ·主题网页识别第37-41页
     ·主题网页模型第37-38页
     ·分类算法第38-41页
     ·主题网页识别算法第41页
   ·本章小结第41-42页
第四章 面向主题的网页采集方法的研究和实现第42-50页
   ·主题页面特征第42-43页
     ·Hub 特征第42页
     ·Linkage/Sibling Locality 特征第42-43页
     ·站点主题特征第43页
     ·Tunnel 特征第43页
   ·主题网络爬虫相关策略和算法第43-47页
     ·基于网页内容的启发式方法第44-46页
     ·基于Web 超链结构的方法第46-47页
   ·基于双约束的网页采集方法第47-49页
   ·本章小结第49-50页
第五章 实验及结果分析第50-53页
   ·性能评价指标第50-51页
   ·实验比较与分析第51-53页
参考文献第53-55页
致谢第55-57页
攻读硕士学位期间已发表或录用的论文第57-59页

论文共59页,点击 下载论文
上一篇:Web查询分类方法的改进
下一篇:基于网络处理器的网络编码实现及优化