首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

Deep Web分类搜索引擎关键技术研究

摘要第1-4页
Abstract第4-9页
第1章 引言第9-14页
   ·问题的提出第9-10页
   ·国内外研究现状第10-12页
   ·论文主要研究内容第12-13页
   ·论文结构第13-14页
第2章 研究基础第14-23页
   ·DEEP WEB 的定义与规模第14-15页
   ·中国DEEP WEB 资源的调查第15-18页
     ·查询接口的深度第15-16页
     ·中国Deep Web 的规模第16页
     ·Deep Web 的结构化程度第16-17页
     ·Web 数据库的领域分布第17页
     ·搜索引擎对Deep Web 的覆盖率第17-18页
   ·搜索引擎概述第18-21页
     ·搜索引擎的产生与分类第18-20页
     ·传统搜索引擎的组成与工作原理第20-21页
   ·传统搜索引擎在DEEP WEB 领域的不足第21-22页
   ·小结第22-23页
第3章 DEEP WEB 站点发现第23-36页
   ·网络爬虫技术第23-27页
     ·网络爬虫原理第23-24页
     ·网络信息搜索策略第24-25页
     ·网络聚焦爬虫第25-27页
   ·查询接口的判定第27-32页
     ·网页表单分类过程第28-29页
     ·网页表单特征提取第29-31页
     ·网页表单分类器第31-32页
   ·DEEP WEB 聚焦爬虫第32-35页
     ·Deep Web 聚焦爬虫系统框架第33-34页
     ·链接与页面的分类第34页
     ·Deep Web 聚焦爬虫核心算法第34-35页
   ·小结第35-36页
第4章 DEEP WEB 数据库内容摘要第36-48页
   ·概述第36-37页
   ·WEB 数据库内容获取第37-40页
     ·Web 数据库内容获取设计流程第37页
     ·查询模式第37-38页
     ·基于查询的结构化内容获取方法第38-39页
     ·有效关键词查询项的选取方法第39-40页
   ·结果页面内容抽取与摘要第40-47页
     ·结果页面的表示第40-43页
     ·网页模板去除第43-45页
     ·抽取查询相关信息第45-46页
     ·生成内容摘要第46-47页
   ·小结第47-48页
第5章 DEEP WEB 数据源分类第48-58页
   ·DEEP WEB 数据源层次分类模式第48-50页
   ·DEEP WEB 数据源分类策略第50-51页
   ·DEEP WEB 接口页面信息获取第51-55页
     ·网页结构信息第51-53页
     ·向量空间模型第53-54页
     ·网页特征提取第54-55页
   ·基于接口页面与数据库摘要相结合的分类方法第55-57页
   ·小结第57-58页
第6章 DEEP WEB 分类搜索引擎系统的设计第58-68页
   ·LUCENE 系统结构分析第58-61页
     ·Lucene 的应用与特点第58-59页
     ·Lucene 系统架构第59-60页
     ·Lucene 索引的组成第60-61页
   ·DEEP SEARCHER 的集成第61-67页
     ·基于Lucene 的架构设计第61-63页
     ·搜索系统的组成第63-64页
     ·对中文处理的支持第64-66页
     ·Deep Searcher 运行结果第66-67页
   ·小结第67-68页
第7章 实验结果与分析第68-74页
   ·实验评价标准第68页
   ·查询接口判定实验第68-69页
   ·DEEP WEB 爬虫实验第69-70页
   ·WEB 数据库内容获取实验第70-71页
   ·DEEP WEB 数据源分类实验第71-73页
   ·小结第73-74页
第8章 总结与展望第74-77页
   ·工作总结第74-75页
   ·工作展望第75-77页
参考文献第77-82页
在学期间发表的学术论文和参加科研情况第82-83页
致谢第83-84页
详细摘要第84-87页

论文共87页,点击 下载论文
上一篇:农村合作经济组织发展模式研究
下一篇:传导性电磁干扰噪声诊断与抑制综合方法研究