首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

Web信息自动抽取技术研究

摘要第1-4页
Abstract第4-9页
第1章 绪论第9-12页
   ·引言第9-10页
   ·本文工作第10-11页
   ·本文组织第11页
   ·本章小结第11-12页
第2章 Web信息抽取研究综述第12-23页
   ·Web信息抽取发展历史第12-13页
   ·Web信息抽取评价标准第13-14页
   ·Web信息抽取相关工作第14-20页
     ·基于知识工程的方法第14页
     ·自动训练的方法第14-16页
     ·基于DOM的Web抽取技术第16-20页
   ·Web信息抽取的问题与改进第20-22页
   ·本章小结第22-23页
第3章 HTML标签树相似性算法第23-30页
   ·树的编辑距离第23-25页
   ·自顶向下限制的树编辑距离第25-27页
   ·树的最大节点匹配第27-28页
   ·本章小结第28-30页
第4章 Web信息自动抽取算法设计第30-46页
   ·网页聚类第31-36页
     ·聚类的概念第32页
     ·层次聚类算法第32-34页
     ·网页聚类算法第34-36页
     ·聚类评估标准第36页
   ·模板生成第36-44页
     ·两个网页的模板第37-38页
     ·多网页模板生成第38-40页
     ·文本模板处理第40-43页
     ·模板表示规范第43-44页
   ·数据抽取与语义标记第44-45页
     ·数据字段抽取第44-45页
     ·数据字段语义标记第45页
   ·本章小结第45-46页
第5章 系统设计与实现第46-53页
   ·总体设计第46-47页
   ·网页获取与存储第47-48页
     ·网页源第47-48页
     ·网页存储第48页
   ·格式化处理第48-49页
   ·系统实现第49-52页
     ·数据存储格式第49-52页
     ·系统界面第52页
   ·本章小结第52-53页
第6章 实验结果评估第53-60页
   ·聚类结果评估第53-54页
   ·模板生成结果第54-55页
   ·语义标记实验评估第55-56页
   ·数据抽取实验评估第56-59页
   ·本章小结第59-60页
第7章 总结与展望第60-63页
   ·总结第60-61页
   ·下一步工作第61-63页
参考文献第63-66页
致谢第66-67页
附录1第67-71页
作者简历第71页

论文共71页,点击 下载论文
上一篇:企业门户消息发布系统的设计与重构
下一篇:片上数据库系统设计与实现