首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

Deep Web查询接口识别与抽取技术研究

摘要第1-4页
Abstract第4-7页
第一章 绪论第7-13页
   ·研究背景第7-9页
   ·国内外研究现状第9-11页
     ·国外研究现状第9-10页
     ·国内研究现状第10-11页
   ·论文的工作介绍第11页
   ·论文的组织结构第11-13页
第二章 相关技术基础第13-19页
   ·Deep Web 信息集成系统第13-14页
   ·查询接口识别技术第14-17页
     ·决策树算法第14-15页
     ·朴素贝叶斯算法第15-16页
     ·k-近邻算法第16-17页
   ·数据抽取技术第17-19页
第三章 Deep Web 查询接口识别第19-37页
   ·Deep Web 站点发现第19-20页
   ·表单特征提取第20-25页
     ·HTML 表单元素第20-22页
     ·表单的 DOM 树表示第22-24页
     ·基于 DOM 和正规表达式的表单特征提取第24-25页
   ·JavaScript 解析第25-30页
     ·JavaScript 作用第25-27页
     ·基于 Rhino 的 JavaScript 解析第27-30页
   ·查询接口识别第30-35页
     ·网页表单分类过程第31页
     ·最大熵模型第31-32页
     ·参数训练算法第32-33页
     ·基于最大熵模型的查询接口识别第33-35页
   ·本章小结第35-37页
第四章 Deep Web 查询接口抽取第37-51页
   ·查询接口表示模型第37-38页
     ·查询接口模式的定义第37页
     ·查询接口模式的表示第37-38页
   ·查询接口模式抽取的难点第38-40页
   ·基于 DOM 的查询接口模式的抽取第40-45页
     ·查询接口分类第40-41页
     ·文本属性和控件属性的抽取第41-42页
     ·文本与控件的属性匹配第42-45页
   ·基于索引路径的查询接口模式抽取第45-49页
     ·索引路径第45页
     ·最大公共前缀第45-46页
     ·索引路径的建立第46-47页
     ·查询接口的抽取第47-49页
   ·本章小结第49-51页
第五章 实验与分析第51-59页
   ·查询接口识别实验第51-54页
     ·实验数据集第51页
     ·实验评价指标第51页
     ·实验结果与分析第51-54页
   ·查询接口模式抽取实验第54-57页
     ·实验数据集第54-55页
     ·实验评价指标第55-56页
     ·实验结果与分析第56-57页
   ·本章小结第57-59页
第六章 总结与展望第59-61页
   ·工作总结第59-60页
   ·工作展望第60-61页
致谢第61-63页
参考文献第63-65页
读研期间研究项目第65-66页

论文共66页,点击 下载论文
上一篇:分布式文本信息处理系统的研究与实现
下一篇:序列比对算法CLUSTAL解析及优化