摘要 | 第4-5页 |
Abstract | 第5页 |
1 绪论 | 第7-15页 |
1.1 研究背景及意义 | 第7页 |
1.2 研究现状 | 第7-13页 |
1.3 本文的研究内容与结构 | 第13-15页 |
2 基于CSS选择器的Web信息抽取方法 | 第15-35页 |
2.1 抽取方法的主要概念 | 第15-20页 |
2.2 MDR抽取算法 | 第20-24页 |
2.3 抽取方法的处理流程 | 第24-31页 |
2.4 结合URL比较法获取相似页面 | 第31-35页 |
3 抽取系统的设计与实现 | 第35-44页 |
3.1 系统的架构 | 第35-38页 |
3.2 系统开发框架的选取 | 第38-41页 |
3.3 系统的实现 | 第41-44页 |
4 亚马逊网站商品评论信息的抽取实验 | 第44-50页 |
4.1 抽取实验的操作步骤 | 第44-48页 |
4.2 抽取实验的结果与系统评价 | 第48-50页 |
5 总结与展望 | 第50-52页 |
5.1 总结 | 第50-51页 |
5.2 展望 | 第51-52页 |
致谢 | 第52-53页 |
参考文献 | 第53-56页 |