首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于主题的Hidden Web信息获取研究

摘要第1-4页
Abstract第4-7页
1 前言第7-11页
   ·研究背景第7-8页
   ·国内外研究现状第8-9页
   ·研究内容和组织结构第9-11页
2 相关知识及技术第11-19页
   ·HIDDEN WEB介绍第11-14页
     ·Hidden Web数据库模型第11-12页
     ·Hidden Web不可见原因第12-13页
     ·Hidden Web分类第13-14页
   ·主题技术第14-15页
   ·爬虫介绍第15-19页
     ·传统爬虫和Hidden Web爬虫比较第15页
     ·Hidden Web爬虫工作原理第15-17页
     ·Hidden Web爬虫的关键技术第17-19页
3 系统设计第19-29页
   ·导航模式第19-20页
   ·爬行问题形式化定义第20-21页
   ·抓取步骤第21-25页
     ·相关性判断第21-23页
     ·寻找表单第23-24页
     ·自动填写表单第24-25页
     ·响应分析第25页
   ·URL处理流程第25-29页
4 启发式查询词选择算法第29-41页
   ·查询关键字选择策略第29-30页
   ·ZIPF定律第30页
   ·算法分析第30-33页
     ·结构化数据库分析第30-32页
     ·算法描述第32-33页
   ·最佳查询词选择第33-36页
     ·文本数据库类型最佳查询词第34-35页
     ·结构化数据库类型最佳查询词第35-36页
   ·数据岛问题的解决第36-37页
   ·查询表维护过程第37-38页
   ·爬行限制返回结果页面数的站点第38-39页
   ·性能评价标准第39-41页
5 实验分析第41-47页
   ·实验过程第41-44页
   ·实验结论第44-47页
6 总结及展望第47-49页
   ·课题的主要工作第47页
   ·进一步的工作第47-49页
致谢第49-51页
参考文献第51-55页
攻读硕士学位期间公开发表论文第55页

论文共55页,点击 下载论文
上一篇:基于ARM9的快速指纹采集网络终端的研究
下一篇:粗糙集理论在入侵检测中的应用研究