首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于元搜索引擎的网页采集技术的研究与实现

摘要第1-4页
Abstract第4-6页
目录第6-8页
第一章 绪论第8-12页
   ·研究背景第8-10页
   ·国内外研究现状第10-11页
   ·本文研究内容及篇章结构第11-12页
第二章 互联网信息处理平台网页采集技术第12-24页
   ·互联网信息处理平台相关技术第12-14页
     ·信息采集技术第12页
     ·数据存储技术第12-13页
     ·分析挖掘技术第13-14页
     ·前端展示技术第14页
   ·网页采集技术第14-18页
     ·通用网络爬虫第15-16页
     ·聚焦网络爬虫第16-17页
     ·深度网络爬虫第17-18页
   ·网页采集技术对比分析第18-19页
   ·基于元搜索引擎的网页采集技术第19-22页
     ·采集型元搜索的优势第20-21页
     ·普通元搜索应用于采集模块所存在的问题及解决方法分析第21-22页
   ·本章小结第22-24页
第三章 LCOOCS: 基于局部共现统计的查询扩展方法第24-38页
   ·问题建模第24-25页
   ·查询扩展技术概述及分析第25-26页
   ·LCOOCS: 基于局部共现统计的查询扩展方法第26-32页
     ·TextEx:一种基于 DOM 树的网页正文抽取新方法第27-30页
     ·基于共现度的词项评价策略第30-32页
   ·实验及分析第32-36页
     ·实验环境第32页
     ·TextEx 算法实验及分析第32-34页
     ·LCOOCS 查询扩展算法实验及分析第34-36页
   ·本章小结第36-38页
第四章 采集型元搜索系统的设计与实现第38-50页
   ·系统总体设计框架第38-39页
   ·搜索下载模块第39-46页
     ·生成搜索 URL第40-42页
     ·搜索引擎调度第42-43页
     ·礼貌控制第43页
     ·搜索结果列表页结构化信息提取第43-45页
     ·网页去重第45-46页
   ·正文抽取模块第46页
   ·搜索词扩展模块第46-47页
   ·系统运行情况第47-48页
   ·本章小结第48-50页
第五章 工作总结与展望第50-52页
   ·工作总结第50-51页
   ·工作展望第51-52页
致谢第52-54页
参考文献第54-57页

论文共57页,点击 下载论文
上一篇:光度立体在机器视觉中的应用研究
下一篇:授权策略冲突与冗余检测工具的设计与实现