| 摘要 | 第4-5页 |
| Abstract | 第5页 |
| 1 绪论 | 第7-15页 |
| 1.1 研究背景及意义 | 第7页 |
| 1.2 研究现状 | 第7-13页 |
| 1.3 本文的研究内容与结构 | 第13-15页 |
| 2 基于CSS选择器的Web信息抽取方法 | 第15-35页 |
| 2.1 抽取方法的主要概念 | 第15-20页 |
| 2.2 MDR抽取算法 | 第20-24页 |
| 2.3 抽取方法的处理流程 | 第24-31页 |
| 2.4 结合URL比较法获取相似页面 | 第31-35页 |
| 3 抽取系统的设计与实现 | 第35-44页 |
| 3.1 系统的架构 | 第35-38页 |
| 3.2 系统开发框架的选取 | 第38-41页 |
| 3.3 系统的实现 | 第41-44页 |
| 4 亚马逊网站商品评论信息的抽取实验 | 第44-50页 |
| 4.1 抽取实验的操作步骤 | 第44-48页 |
| 4.2 抽取实验的结果与系统评价 | 第48-50页 |
| 5 总结与展望 | 第50-52页 |
| 5.1 总结 | 第50-51页 |
| 5.2 展望 | 第51-52页 |
| 致谢 | 第52-53页 |
| 参考文献 | 第53-56页 |