深层网络信息发掘技术研究
| 摘要 | 第1-5页 |
| Abstract | 第5-9页 |
| 第1章 绪论 | 第9-14页 |
| ·课题背景 | 第9-10页 |
| ·国内外研究现状及分析 | 第10-12页 |
| ·本文的研究内容和章节安排 | 第12-14页 |
| 第2章 深层网络信息发掘相关技术研究 | 第14-37页 |
| ·如何呈现深层网络信息 | 第14-15页 |
| ·相关方法对比 | 第14页 |
| ·本文采用的策略 | 第14-15页 |
| ·Larbin 架构分析及优化 | 第15-19页 |
| ·Larbin 的架构分析 | 第15-16页 |
| ·Larbin 的优化 | 第16-19页 |
| ·关键技术研究 | 第19-36页 |
| ·Deep Web 数据源发现及表单接口提取 | 第19-22页 |
| ·自动填写表单内容 | 第22-28页 |
| ·查询返回页面内容抽取 | 第28-32页 |
| ·语义元数据提取 | 第32-35页 |
| ·爬取后数据内容更新 | 第35-36页 |
| ·本章小结 | 第36-37页 |
| 第3章 整体系统设计与实现 | 第37-49页 |
| ·系统框架设计 | 第37-38页 |
| ·表单提取与处理模块设计与实现 | 第38-43页 |
| ·关键数据结构与代码 | 第39-40页 |
| ·关键逻辑流程 | 第40-43页 |
| ·URL 构造及页面生成与抽取模块设计与实现 | 第43-48页 |
| ·关键数据结构与代码 | 第45页 |
| ·关键逻辑流程 | 第45-48页 |
| ·本章小结 | 第48-49页 |
| 第4章 实验与结果分析 | 第49-58页 |
| ·实际运行测试 | 第49-50页 |
| ·算法验证测试 | 第50-57页 |
| ·自动填写表单算法验证 | 第50-51页 |
| ·页面内容抽取算法验证 | 第51-57页 |
| ·本章小结 | 第57-58页 |
| 结论 | 第58-60页 |
| 参考文献 | 第60-64页 |
| 攻读学位期间发表的学术论文 | 第64-66页 |
| 致谢 | 第66页 |