面向Web的图书信息抽取方法与实现
摘要 | 第1-6页 |
Abstract | 第6-9页 |
1 引言 | 第9-20页 |
·研究背景和意义 | 第9-10页 |
·信息抽取技术概述 | 第10-12页 |
·Web信息抽取研究现状 | 第12-15页 |
·Web信息抽取技术分类 | 第15-17页 |
·Web信息抽取系统的设计方法 | 第17页 |
·本文的研究内容及论文组织 | 第17-20页 |
2 相关术语及技术 | 第20-25页 |
·HTML | 第20-21页 |
·HTTP技术 | 第21-22页 |
·SOCKET技术 | 第22-24页 |
·本章小结 | 第24-25页 |
3 含图书信息的 Web页面抓取系统 | 第25-40页 |
·Web页面抓取系统结构 | 第25-29页 |
·URL及网页去重 | 第29-33页 |
·网页去噪 | 第33-38页 |
·网页抓取系统评价 | 第38-39页 |
·本章小结 | 第39-40页 |
4 图书信息抽取方法与系统 | 第40-60页 |
·图书信息抽取系统结构 | 第40-41页 |
·图书信息样本的手工标注 | 第41-44页 |
·图书信息抽取规则的学习 | 第44-52页 |
·基于规则的图书信息抽取 | 第52-59页 |
·本章小结 | 第59-60页 |
5 原型系统设计与实现 | 第60-65页 |
·网页抓取系统的实现 | 第60-61页 |
·图书信息抽取系统的实现 | 第61-63页 |
·试验结果和分析 | 第63-64页 |
·本章小结 | 第64-65页 |
6 结论与展望 | 第65-67页 |
致谢 | 第67-68页 |
攻读硕士期间主要成果 | 第68-69页 |
参考文献 | 第69-71页 |