首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

自底向上的Web数据抽取方法研究

摘要第1-6页
Abstract第6-9页
第1章 引言第9-15页
   ·课题背景第9-10页
   ·国内外研究现状第10-12页
   ·本文研究的内容第12-13页
   ·本文研究思路及组织结构第13-15页
第2章 相关概念与技术第15-23页
   ·Web相关技术第15-20页
     ·HTML技术第15-16页
     ·XHTML技术第16-17页
     ·XML技术第17-18页
     ·DOM技术简介第18-19页
     ·XPath技术第19-20页
   ·决策树第20-22页
     ·决策树简介第20页
     ·决策树表示方法第20-21页
     ·决策树适用的问题第21-22页
     ·基本的决策树学习算法第22页
   ·本章小结第22-23页
第3章 基于实体的数据抽取方法第23-39页
   ·基于实体的Web数据抽取模型第23-26页
   ·自底向上抽取方法面临的问题和挑战第26-30页
   ·实体抽取策略第30-38页
     ·文本划分策略第31-33页
     ·实体属性标注第33-38页
   ·本章小结第38-39页
第4章 重复模式抽取与数据抽取策略第39-57页
   ·重复模式抽取第40-47页
     ·确定关键属性第40-41页
     ·候选重复模式提取第41-43页
     ·确定实体属性第43-46页
     ·生成重复模式第46-47页
   ·抽取模式化简第47-50页
   ·数据抽取第50-53页
     ·构建抽取模式树第50-52页
     ·数据抽取策略第52-53页
   ·页面分层思想第53-55页
   ·本章小结第55-57页
第5章 实验与分析第57-67页
   ·实验环境第57页
   ·评价标准第57-58页
   ·实验结果及分析第58-64页
     ·二级抽取模型实验第58-59页
     ·抽取模式生成策略第59-61页
     ·数据抽取实验第61-64页
   ·本章小结第64-67页
第6章 结论第67-69页
   ·本文的主要贡献与结论第67-68页
   ·进一步的工作第68-69页
参考文献第69-73页
致谢第73-75页
攻硕期间参加的项目及发表的论文第75页

论文共75页,点击 下载论文
上一篇:基于手绘草图识别的电原理图生成
下一篇:基于频繁聚类的Web Mashup模式挖掘研究