首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于脚本代码和局部数据匹配的网页抽取研究

摘要第1-10页
ABSTRACT第10-12页
第1章 绪论第12-15页
   ·研究背景及意义第12-13页
   ·研究的主要问题第13页
   ·本文的主要工作第13-14页
   ·本文的结构第14-15页
第2章 网页信息抽取综述第15-21页
   ·信息抽取概念第15页
   ·网页信息抽取技术第15-18页
     ·基于对象树模型的抽取方法第16页
     ·基于理解模型的抽取方法第16-17页
     ·基于视觉模型的抽取方法第17页
     ·总结第17-18页
   ·全自动网页信息抽取技术简介第18-21页
第3章 基于CCM树的相似网页聚类方法第21-34页
   ·网页脚本代码第21-22页
   ·CCM树定义、表示及构建算法第22-28页
   ·CCM树聚类第28-32页
   ·ECCM树第32-34页
第4章 基于局部数据匹配的抽取方法第34-41页
   ·关键数据区域第34页
   ·TOP-DOWN树匹配算法第34-37页
   ·ETD局部特征匹配算法第37-40页
   ·数据抽取和信息标记第40-41页
第5章 实验结果与评价第41-45页
   ·实验数据集及环境第41页
   ·实验结果与分析第41-45页
     ·树大小对比第41-42页
     ·阈值分析与准确性对比第42-43页
     ·聚类时间第43-44页
     ·抽取效果对比第44-45页
第6章 总结与展望第45-47页
   ·总结第45页
   ·未来的工作第45-47页
参考文献第47-50页
致谢第50-51页
攻读学位期间参与科研项目情况第51-52页
学位论文评阅及答辩情况表第52页

论文共52页,点击 下载论文
上一篇:基于聚类算法的网络应用协议识别系统的研究与实现
下一篇:云计算环境下基于SLA的多服务应用的资源分配机制的研究