首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

Deep Web数据抽取关键技术研究

摘要第1-12页
ABSTRACT第12-14页
第一章 绪论第14-18页
   ·研究背景及意义第14-16页
   ·研究的内容第16页
   ·论文的贡献第16-17页
   ·论文的组织第17-18页
第二章 Web数据抽取的研究现状第18-26页
   ·引言第18-19页
   ·Web数据抽取技术分类及技术分析第19-25页
     ·基于自然语言处理的方法第19-20页
     ·基于抽取规则推导的方法第20页
     ·基于本体的方法第20-21页
     ·基于模式的方法第21-22页
     ·基于页面抽取语言的方法第22页
     ·基于HTML结构的方法第22-24页
     ·基于页面视觉信息的方法第24-25页
   ·Web数据抽取存在的问题第25页
   ·本章小结第25-26页
第三章 基于字符串模式匹配的页面模板生成方法第26-40页
   ·引言第26-28页
   ·相关定义第28-31页
     ·有层次的DOM树前序遍历字符串第28-29页
     ·DOM树中的重复结构的聚类第29-31页
   ·页面模板生成第31-35页
     ·DOM树中重复结构聚类算法第31-33页
     ·页面模板推理算法第33-35页
   ·实验第35-38页
     ·数据集第35页
     ·实验评价标准第35页
     ·实验结果及分析第35-38页
       ·对Web页面结构推理的论证第35-36页
       ·对于生成页面模板稳定性的验证第36-37页
       ·对比不同页面模板生成方法对Web数据抽取性能的影响第37-38页
   ·相关工作第38-39页
   ·本章小结第39-40页
第四章 基于页面视觉特征约束条件随机场的Web数据语义标注方法第40-58页
   ·引言第40-41页
   ·Web页面上的视觉特征第41-44页
     ·页面布局第41-42页
     ·文字表现第42页
     ·数据的页面视觉特征序列第42-43页
     ·公共视觉特征第43-44页
   ·传统条件随机场模型第44-46页
   ·页面视觉特征约束条件随机场模型第46-50页
     ·模型介绍第46-47页
     ·参数估计与推理第47-49页
     ·特征函数、特征评估与训练样本第49-50页
   ·实验第50-55页
     ·数据集第50-51页
     ·实验评价标准第51页
     ·实验结果及分析第51-55页
       ·VFC-CRFs与CRCs、HMMs的标注性能比较第51-53页
       ·样本数据对VFC-CRFs模型性能的影响第53-55页
   ·相关工作第55-56页
   ·本章小结第56-58页
第五章 总结与展望第58-60页
   ·总结第58页
   ·展望第58-60页
参考文献第60-65页
致谢第65-66页
攻读学位期间发表的学术论文目录第66-67页
攻读学位期间参与科研项目情况第67-68页
学位论文评阅及答辩情况表第68页

论文共68页,点击 下载论文
上一篇:单光子调制光谱与成像特性研究
下一篇:连续变量量子纠缠的产生和条件克隆