基于人工标注技术的网页内容抽取系统开发
摘要 | 第1-5页 |
Abstract | 第5-6页 |
第一章 引言 | 第6-11页 |
·网页内容抽取发展的现状 | 第6-8页 |
·网页内容抽取存在的问题 | 第8-9页 |
·本文的主要内容 | 第9-10页 |
·本文的篇章结构 | 第10-11页 |
第二章 人工标注技术基础 | 第11-17页 |
·网页扩展技术的分析 | 第11-12页 |
·网页扩展技术规范 | 第12-13页 |
·网页渲染技术规范 | 第13-17页 |
第三章 网页内容抽取系统需求分析 | 第17-26页 |
·网页内容抽取系统总体需求 | 第17-18页 |
·网页内容抽取系统核心功能 | 第18-26页 |
·抽取配置管理 | 第18-24页 |
·抽取结果处理 | 第24-26页 |
第四章 网页内容抽取系统设计 | 第26-47页 |
·系统软件架构设计 | 第26页 |
·人工标注核心子系统的设计 | 第26-44页 |
·用户管理的设计 | 第27-28页 |
·人工标注管理的设计 | 第28-31页 |
·文本分块的设计 | 第31-40页 |
·抽取规则处理的设计 | 第40-43页 |
·数据导出及浏览的设计 | 第43-44页 |
·与同类系统比较 | 第44页 |
·网页内容抽取质量评测结果 | 第44-46页 |
·小结 | 第46-47页 |
第五章 结论 | 第47-49页 |
·基于人工标注的网页抽取系统的特点 | 第47页 |
·不足与展望 | 第47-49页 |
参考文献 | 第49-51页 |
致谢 | 第51-52页 |