面向Web的图书信息抽取方法与实现

摘要	第1-6页
Abstract	第6-9页
1 引言	第9-20页
·研究背景和意义	第9-10页
·信息抽取技术概述	第10-12页
·Web信息抽取研究现状	第12-15页
·Web信息抽取技术分类	第15-17页
·Web信息抽取系统的设计方法	第17页
·本文的研究内容及论文组织	第17-20页
2 相关术语及技术	第20-25页
·HTML	第20-21页
·HTTP技术	第21-22页
·SOCKET技术	第22-24页
·本章小结	第24-25页
3 含图书信息的 Web页面抓取系统	第25-40页
·Web页面抓取系统结构	第25-29页
·URL及网页去重	第29-33页
·网页去噪	第33-38页
·网页抓取系统评价	第38-39页
·本章小结	第39-40页
4 图书信息抽取方法与系统	第40-60页
·图书信息抽取系统结构	第40-41页
·图书信息样本的手工标注	第41-44页
·图书信息抽取规则的学习	第44-52页
·基于规则的图书信息抽取	第52-59页
·本章小结	第59-60页
5 原型系统设计与实现	第60-65页
·网页抓取系统的实现	第60-61页
·图书信息抽取系统的实现	第61-63页
·试验结果和分析	第63-64页
·本章小结	第64-65页
6 结论与展望	第65-67页
致谢	第67-68页
攻读硕士期间主要成果	第68-69页
参考文献	第69-71页