首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于人工标注技术的网页内容抽取系统开发

摘要第1-5页
Abstract第5-6页
第一章 引言第6-11页
   ·网页内容抽取发展的现状第6-8页
   ·网页内容抽取存在的问题第8-9页
   ·本文的主要内容第9-10页
   ·本文的篇章结构第10-11页
第二章 人工标注技术基础第11-17页
   ·网页扩展技术的分析第11-12页
   ·网页扩展技术规范第12-13页
   ·网页渲染技术规范第13-17页
第三章 网页内容抽取系统需求分析第17-26页
   ·网页内容抽取系统总体需求第17-18页
   ·网页内容抽取系统核心功能第18-26页
     ·抽取配置管理第18-24页
     ·抽取结果处理第24-26页
第四章 网页内容抽取系统设计第26-47页
   ·系统软件架构设计第26页
   ·人工标注核心子系统的设计第26-44页
     ·用户管理的设计第27-28页
     ·人工标注管理的设计第28-31页
     ·文本分块的设计第31-40页
     ·抽取规则处理的设计第40-43页
     ·数据导出及浏览的设计第43-44页
   ·与同类系统比较第44页
   ·网页内容抽取质量评测结果第44-46页
   ·小结第46-47页
第五章 结论第47-49页
   ·基于人工标注的网页抽取系统的特点第47页
   ·不足与展望第47-49页
参考文献第49-51页
致谢第51-52页

论文共52页,点击 下载论文
上一篇:号码回呼验证技术在电子商务可信交易中的应用研究
下一篇:面向政府的网络信息自动抓取的系统设计与实现