首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于表格结构的Web信息提取技术研究

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-16页
   ·研究背景及意义第10-12页
     ·研究背景第10-11页
     ·研究意义第11-12页
   ·国内外研究现状第12-14页
   ·本文的研究目的及内容第14-15页
   ·本文的组织结构第15-16页
第2章 基于表格结构的Web 信息提取技术第16-26页
   ·基于表格结构的Web 信息提取概述第16-19页
     ·基于表格结构的Web 信息提取方法第16-17页
     ·基于表格结构的Web 信息提取关键技术第17-18页
     ·基于表格结构的Web 信息提取的评价指标第18-19页
   ·统计学习中的基本问题第19-20页
     ·建模第19-20页
     ·特征选择第20页
   ·决策树分类算法概述第20-23页
     ·决策树分类算法简介第20-21页
     ·决策树的生成第21-22页
     ·决策树的测试属性选择第22-23页
     ·决策树的剪枝第23页
   ·基于表格结构的Web 信息提取的逻辑结构图第23-25页
   ·本章小结第25-26页
第3章 基于HTML 结构树的列表信息提取第26-38页
   ·Web 页中列表的显示形式第26-28页
   ·HTML 结构树概述第28-31页
     ·HTML 结构树的概念第28-29页
     ·由HTML 文档构造HTML 结构树第29-31页
   ·基于HTML 结构树的列表信息提取第31-34页
     ·信息所在区域的确定第31-32页
     ·最大扇出子树第32页
     ·记录划分策略第32页
     ·提取算法第32-34页
   ·实验及分析第34-36页
   ·本章小结第36-38页
第4章 基于特征向量机器学习算法的Web 表格识别第38-52页
   ·Web 页中表格概述第38-41页
     ·表格的作用第38页
     ·表格元素的表达第38-40页
     ·表格的基本类型第40-41页
   ·基于特征向量机器学习算法的Web 表格识别第41-47页
     ·表格特征向量的构造第41-46页
     ·决策树分类器的生成第46-47页
   ·实验及分析第47-51页
     ·实验环境及数据集第47页
     ·预处理第47页
     ·实验结果分析第47-51页
   ·本章小结第51-52页
第5章 基于多阶二维条件随机场模型的表格信息提取第52-64页
   ·问题的形式化描述第52-54页
     ·序列标注第52页
     ·序列标注模型第52-54页
   ·二维条件随机场模型(2DCRFS)第54-55页
   ·多阶二维条件随机场模型(MF-2DCRFS)第55-56页
   ·MF-2DCRFs 模型的训练第56-59页
     ·MF-2DCRFs 模型的矩阵计算第57-58页
     ·MF-2DCRFs 模型的参数估计与标注第58-59页
   ·实验及分析第59-63页
     ·数据集第59页
     ·预处理第59-60页
     ·实验结果分析第60-63页
   ·本章小结第63-64页
结论第64-66页
参考文献第66-71页
攻读硕士学位期间承担的科研任务与主要成果第71-72页
致谢第72-73页
作者简介第73页

论文共73页,点击 下载论文
上一篇:IDS中模糊模式识别方法的研究
下一篇:Web社区发现算法的研究与实现