基于CEF的页面分割算法的研究
摘要 | 第7-8页 |
Abstract | 第8-9页 |
1 引言 | 第12-19页 |
1.1 研究背景和意义 | 第12-13页 |
1.2 国内外研究现状 | 第13-17页 |
1.3 本文研究的问题和内容 | 第17页 |
1.4 本文的组织结构 | 第17-19页 |
2 相关技术研究 | 第19-27页 |
2.1 HTML语言介绍 | 第19-20页 |
2.2 DOM技术研究 | 第20-23页 |
2.2.1 DOM结点的分类 | 第20-21页 |
2.2.2 DOM树结构及其操作 | 第21-23页 |
2.3 网页中的视觉信息 | 第23页 |
2.4 基于视觉信息的页面分割算法 | 第23-26页 |
2.5 小结 | 第26-27页 |
3 基于JS的CEF功能的扩展 | 第27-39页 |
3.1 问题的描述 | 第27页 |
3.2 浏览器控件 | 第27-35页 |
3.2.1 WebBrowser | 第28-29页 |
3.2.2 CEF框架 | 第29-31页 |
3.2.3 WebBrowser和CEF对比试验 | 第31-35页 |
3.3 利用JS获取页面的视觉信息 | 第35-37页 |
3.4 在CEF中访问页面结点 | 第37-38页 |
3.5 小结 | 第38-39页 |
4 基于CEF的VIPS算法的实现 | 第39-57页 |
4.1 问题的描述 | 第39-40页 |
4.2 视觉块抽取 | 第40-46页 |
4.2.1 内容一致度DoC以及PDoC | 第40-41页 |
4.2.2 结点的分类 | 第41-42页 |
4.2.3 视觉块抽取算法 | 第42-46页 |
4.3 分隔条探测 | 第46-50页 |
4.3.1 分隔条探测算法 | 第46-49页 |
4.3.2 分隔条权重 | 第49-50页 |
4.4 内容结构构建 | 第50-53页 |
4.4.1 内容结构构建算法 | 第50-52页 |
4.4.2 内容结构构建示例 | 第52-53页 |
4.5 算法设计中的问题 | 第53-54页 |
4.6 实验结果与分析 | 第54-56页 |
4.7 小结 | 第56-57页 |
5 总结和展望 | 第57-59页 |
5.1 总结 | 第57页 |
5.2 展望 | 第57-59页 |
参考文献 | 第59-62页 |
致谢 | 第62-63页 |
个人简历 | 第63页 |