基于聚类算法的Web信息抽取技术研究

摘要	第1-5页
Abstract	第5-6页
目录	第6-7页
1 绪论	第7-11页
·课题背景与意义	第7-8页
·国内外研究现状	第8-9页
·论文研究内容	第9-10页
·论文组织结构	第10-11页
2 Web信息抽取技术概述	第11-17页
·Web信息抽取的概念	第11页
·目前的Web信息抽取方法比较	第11-14页
·Web信息抽取存在的问题	第14-16页
·本章小结	第16-17页
3 网页结构研究与网页聚类	第17-31页
·HTML和DOM简介	第17-19页
·网页结构相似性研究	第19-25页
·网页聚类	第25-30页
·本章小结	第30-31页
4 基于相似页面的数据记录定位	第31-44页
·包装器生成	第31-39页
·语义标注	第39-42页
·信息抽取与存储	第42-43页
·本章小结	第43-44页
5 Web自动信息抽取系统实现及评价	第44-55页
·实验环境	第44页
·信息抽取系统实现	第44-49页
·信息抽取系统评价	第49-54页
·本章小结	第54-55页
6 总结与展望	第55-57页
·总结	第55-56页
·进一步研究	第56-57页
参考文献	第57-60页
在学期间发表论文清单	第60-61页
致谢	第61页