首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

深度网络信息爬取关键技术研究与实现

致谢第1-5页
摘要第5-6页
Abstract第6-7页
目录第7-9页
图目录第9-10页
表目录第10-11页
第1章 绪论第11-16页
   ·背景第11-12页
   ·搜索引擎的发展历史第12页
   ·搜索引擎的未来第12-13页
   ·深度网络的现状第13-14页
   ·本文的工作和组织第14-16页
第2章 相关技术的研究现状第16-33页
   ·搜索引擎基本技术第16-17页
   ·网络爬虫技术第17-21页
     ·网络爬虫的基本特征第18页
     ·网络爬虫的基本架构第18-19页
     ·分布式爬虫的设计第19-21页
   ·文本聚类技术第21-30页
     ·聚类算法在信息检索中的应用现状第22-23页
     ·聚类算法理论发展现状第23-27页
     ·聚类算法的结果评估指标第27-30页
   ·深度网络信息获取技术第30-32页
     ·深度网络信息获取的基本流程框架第30-31页
     ·基于运行时查询变换的技术第31-32页
     ·基于深度网络表面化的技术第32页
   ·本章小结第32-33页
第3章 基于最优查询的深度网络爬取第33-51页
   ·页面预处理第33-37页
     ·系统的总体结构第33-34页
     ·HTML页面中的表单分析第34-35页
     ·非搜索性表单的过滤第35-37页
   ·网页的聚类第37-44页
     ·网页间相似度的计算第38-41页
     ·使用K-means算法对网页进行聚类第41-42页
     ·利用网页间链接信息对聚类结果进行改进第42-44页
   ·最优查询的生产及提交第44-50页
     ·类别型文本框的建模及识别第45-48页
     ·通用型文本框的最优查询生产第48-50页
   ·本章小结第50-51页
第4章 ZVerticalSearch系统设计与测试第51-69页
   ·设计思想第51-52页
   ·体系结构第52-61页
     ·网络蜘蛛第53-56页
     ·URL链接容器第56-58页
     ·最优查询词库第58-59页
     ·网页解析及索引处理模块第59-61页
   ·算法实验第61-68页
     ·聚类算法测试第61-66页
     ·最优查询提交测试第66-68页
   ·本章小结第68-69页
第5章 总结与展望第69-71页
   ·总结第69页
   ·展望第69-71页
参考文献第71-75页
攻读硕士学位期间主要的研究成果第75页

论文共75页,点击 下载论文
上一篇:基于结构与视觉一致性的网页新闻提取研究及应用
下一篇:面向视频直播的应用层多播技术研究与系统实现