基于人工标注技术的网页内容抽取系统开发
| 摘要 | 第1-5页 |
| Abstract | 第5-6页 |
| 第一章 引言 | 第6-11页 |
| ·网页内容抽取发展的现状 | 第6-8页 |
| ·网页内容抽取存在的问题 | 第8-9页 |
| ·本文的主要内容 | 第9-10页 |
| ·本文的篇章结构 | 第10-11页 |
| 第二章 人工标注技术基础 | 第11-17页 |
| ·网页扩展技术的分析 | 第11-12页 |
| ·网页扩展技术规范 | 第12-13页 |
| ·网页渲染技术规范 | 第13-17页 |
| 第三章 网页内容抽取系统需求分析 | 第17-26页 |
| ·网页内容抽取系统总体需求 | 第17-18页 |
| ·网页内容抽取系统核心功能 | 第18-26页 |
| ·抽取配置管理 | 第18-24页 |
| ·抽取结果处理 | 第24-26页 |
| 第四章 网页内容抽取系统设计 | 第26-47页 |
| ·系统软件架构设计 | 第26页 |
| ·人工标注核心子系统的设计 | 第26-44页 |
| ·用户管理的设计 | 第27-28页 |
| ·人工标注管理的设计 | 第28-31页 |
| ·文本分块的设计 | 第31-40页 |
| ·抽取规则处理的设计 | 第40-43页 |
| ·数据导出及浏览的设计 | 第43-44页 |
| ·与同类系统比较 | 第44页 |
| ·网页内容抽取质量评测结果 | 第44-46页 |
| ·小结 | 第46-47页 |
| 第五章 结论 | 第47-49页 |
| ·基于人工标注的网页抽取系统的特点 | 第47页 |
| ·不足与展望 | 第47-49页 |
| 参考文献 | 第49-51页 |
| 致谢 | 第51-52页 |