针对Deep Web数据库查询接口模式抽取的研究
内容提要 | 第1-8页 |
第1章 绪论 | 第8-12页 |
·模式抽取的研究意义 | 第8-9页 |
·国内外研究现状 | 第9-10页 |
·本文的工作内容 | 第10页 |
·论文组织结构 | 第10-12页 |
第2章 相关知识 | 第12-20页 |
·决策树的应用 | 第12-13页 |
·ID3算法 | 第12-13页 |
·基于决策树的查询接口判定 | 第13页 |
·HTML页面结构 | 第13-19页 |
·查询接口页面特征 | 第19-20页 |
第3章 查询接口判别 | 第20-28页 |
·训练样本格式规定与获取 | 第20-22页 |
·决策树的生成 | 第22-26页 |
·生成树函数 | 第22-23页 |
·代码的实现 | 第23-26页 |
·程序评价 | 第26页 |
·决策规则的获得 | 第26-28页 |
第4章 查询接口模式抽取 | 第28-45页 |
·查询接口预处理 | 第28-39页 |
·噪声去除 | 第28-30页 |
·空元素结构的处理 | 第30-33页 |
·首尾对应标记包围结构的处理 | 第33-35页 |
·首尾标记包围结构处理函数的优化 | 第35-39页 |
·查询接口处理函数的调用 | 第39-42页 |
·首尾包围标记的提取处理 | 第40页 |
·标记元素所对应的属性的处理 | 第40-41页 |
·文件的整理 | 第41-42页 |
·查询接口的抽取 | 第42-45页 |
·相关思想 | 第43页 |
·抽取方法 | 第43-45页 |
第5章 实验分析 | 第45-52页 |
·决策树的生成与使用 | 第45-48页 |
·训练样本的定义 | 第45-47页 |
·决策树的性能评价 | 第47-48页 |
·文件接口的处理 | 第48-52页 |
·查询接口模式的抽取 | 第49-50页 |
·性能评价 | 第50-52页 |
第6章 总结 | 第52-54页 |
·研究内容与不足 | 第52页 |
·展望 | 第52-54页 |
参考文献 | 第54-56页 |
致谢 | 第56-57页 |
摘要 | 第57-59页 |
Abstract | 第59-60页 |