针对Deep Web数据库查询接口模式抽取的研究
| 内容提要 | 第1-8页 |
| 第1章 绪论 | 第8-12页 |
| ·模式抽取的研究意义 | 第8-9页 |
| ·国内外研究现状 | 第9-10页 |
| ·本文的工作内容 | 第10页 |
| ·论文组织结构 | 第10-12页 |
| 第2章 相关知识 | 第12-20页 |
| ·决策树的应用 | 第12-13页 |
| ·ID3算法 | 第12-13页 |
| ·基于决策树的查询接口判定 | 第13页 |
| ·HTML页面结构 | 第13-19页 |
| ·查询接口页面特征 | 第19-20页 |
| 第3章 查询接口判别 | 第20-28页 |
| ·训练样本格式规定与获取 | 第20-22页 |
| ·决策树的生成 | 第22-26页 |
| ·生成树函数 | 第22-23页 |
| ·代码的实现 | 第23-26页 |
| ·程序评价 | 第26页 |
| ·决策规则的获得 | 第26-28页 |
| 第4章 查询接口模式抽取 | 第28-45页 |
| ·查询接口预处理 | 第28-39页 |
| ·噪声去除 | 第28-30页 |
| ·空元素结构的处理 | 第30-33页 |
| ·首尾对应标记包围结构的处理 | 第33-35页 |
| ·首尾标记包围结构处理函数的优化 | 第35-39页 |
| ·查询接口处理函数的调用 | 第39-42页 |
| ·首尾包围标记的提取处理 | 第40页 |
| ·标记元素所对应的属性的处理 | 第40-41页 |
| ·文件的整理 | 第41-42页 |
| ·查询接口的抽取 | 第42-45页 |
| ·相关思想 | 第43页 |
| ·抽取方法 | 第43-45页 |
| 第5章 实验分析 | 第45-52页 |
| ·决策树的生成与使用 | 第45-48页 |
| ·训练样本的定义 | 第45-47页 |
| ·决策树的性能评价 | 第47-48页 |
| ·文件接口的处理 | 第48-52页 |
| ·查询接口模式的抽取 | 第49-50页 |
| ·性能评价 | 第50-52页 |
| 第6章 总结 | 第52-54页 |
| ·研究内容与不足 | 第52页 |
| ·展望 | 第52-54页 |
| 参考文献 | 第54-56页 |
| 致谢 | 第56-57页 |
| 摘要 | 第57-59页 |
| Abstract | 第59-60页 |