首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

非结构化Deep Web信息的自动抽取

提要第1-7页
第一章 绪论第7-18页
   ·DeepWeb的概念第8-9页
   ·DeepWeb的类型第9-12页
   ·DeepWeb的特点第12-13页
   ·DeepWeb搜索引擎爬虫第13-17页
     ·爬虫的组成原理第14-15页
     ·爬虫的关键技术第15-17页
   ·本文的工作第17-18页
第二章 相关知识介绍第18-30页
   ·标记语言第18-21页
   ·表单第21-24页
   ·POST与GET第24-25页
   ·SAX与DOM第25-27页
   ·正则表达式第27-28页
   ·信息抽取技术第28-30页
第三章 查询响应页面的信息抽取第30-49页
   ·DeepWeb的探查第30-33页
   ·响应页面的格式转换第33-35页
   ·抽取查询结果对应标签路径第35-42页
   ·抽取查询结果总数对应标签路径第42-44页
   ·识别异常响应页面第44-46页
   ·下载非结构化文件资源第46-47页
   ·相关数据结构第47-49页
第四章 实验部分第49-55页
   ·实验对象第49-50页
     ·Dialog检索系统第49页
     ·PubMed检索系统第49-50页
     ·Ovid检索系统第50页
   ·实验过程第50-55页
     ·响应页面的获取与格式转换第50-51页
     ·抽取查询结果对应标签路径第51-53页
     ·抽取查询结果总数对应标签路径第53-54页
     ·识别异常响应页面与下载资源第54-55页
第五章 总结与展望第55-57页
参考文献第57-60页
摘要第60-63页
Abstract第63-66页
致谢第66-67页
导师及作者简介第67页

论文共67页,点击 下载论文
上一篇:明代女性碑传文与品官命妇研究
下一篇:复社研究