首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

垂直搜索引擎中的网页对象抽取模型及实现技术研究

摘要第1-6页
Abstract第6-10页
插图索引第10-11页
第1章 绪论第11-16页
   ·Web 信息抽取研究综述第11-12页
     ·研究背景与意义第11页
     ·国内外文献综述第11-12页
   ·垂直搜索引擎原理及信息抽取的应用第12-14页
   ·本文所做的主要工作第14页
   ·本文组织安排第14-15页
   ·小结第15-16页
第2章 Web 信息抽取技术概述第16-21页
   ·引言第16页
   ·Web 信息抽取评价标准第16页
   ·基于知识工程的方法第16-17页
   ·基于自动训练的方法第17-19页
     ·基于统计学习的方法第17-18页
     ·基于模式分析的方法第18页
     ·基于归纳学习的方法第18-19页
   ·基于 DOM 树的 Web 信息抽取技术第19-20页
   ·小结第20-21页
第3章 Web 信息抽取系统第21-27页
   ·引言第21页
   ·Web 信息抽取系统的分类第21-22页
   ·主要 Web 信息抽取系统介绍第22-23页
   ·垂直搜索引擎中信息抽取系统的构成第23-26页
     ·模板检测第24-25页
     ·模板生成第25页
     ·数据抽取第25-26页
   ·小结第26-27页
第4章 基于页面布局的模板检测研究第27-36页
   ·引言第27页
   ·基于页面布局的网页聚类算法第27-33页
     ·树编辑距离第28-29页
     ·网页结构相似性计算第29-33页
     ·基于页面布局的网页聚类算法第33页
   ·实验及分析第33-35页
   ·小结第35-36页
第5章 模板生成与数据抽取算法研究第36-46页
   ·引言第36页
   ·模板生成第36-42页
     ·网页模板表示第36-37页
     ·DOM 树到扩展DOM 树的转化第37-39页
     ·基于聚类的模板混合生成算法第39-42页
   ·数据抽取第42-44页
     ·网页对象定义第42-43页
     ·网页对象标注与抽取第43-44页
   ·实验及分析第44-45页
   ·小结第45-46页
第6章 垂直搜索引擎中网页对象抽取系统实现第46-57页
   ·引言第46页
   ·商业搜索引擎的特殊性第46-47页
   ·基于商业考虑的系统优化第47-51页
     ·URL 模式分析第47-48页
     ·搜集路径优化第48-50页
     ·实验及分析第50-51页
   ·系统设计第51-52页
   ·系统实现第52-56页
     ·数据格式第52-55页
     ·系统界面第55-56页
   ·小结第56-57页
结论第57-59页
参考文献第59-64页
致谢第64-65页
附录A 攻读学位期间完成的研究成果第65-66页
附录B 攻读学位期间参与的科研项目第66页

论文共66页,点击 下载论文
上一篇:一种基于CMM的软件过程度量改进模型研究及应用
下一篇:异构系统中基于可用性的抢占式任务调度算法研究