网站数据的提取方法的研究
摘要 | 第5-6页 |
Abstract | 第6-7页 |
第1章 绪论 | 第9-13页 |
1.1 研究背景和意义 | 第9-10页 |
1.2 国内外研究现状 | 第10-11页 |
1.3 研究内容 | 第11-12页 |
1.4 本文组织结构 | 第12-13页 |
第2章 相关技术 | 第13-22页 |
2.1 html和xml | 第13-15页 |
2.2 url和http | 第15-18页 |
2.3 dom方法 | 第18-19页 |
2.4 爬虫 | 第19-22页 |
第3章 几种web信息获取应用 | 第22-30页 |
3.1 web apis | 第22-24页 |
3.2 RSS | 第24-26页 |
3.3 搜索引擎 | 第26-30页 |
第4章 web信息提取系统的设计 | 第30-43页 |
4.1 实验目标 | 第31页 |
4.2 系统开发环境 | 第31页 |
4.3 系统整体工作流程 | 第31-32页 |
4.4 phantomJS+php整合 | 第32-37页 |
4.5 模块设计 | 第37-42页 |
4.5.1 信息提取模块 | 第38-39页 |
4.5.2 信息标准化模块 | 第39-41页 |
4.5.3 图表模块 | 第41-42页 |
4.6 数据库的设计 | 第42-43页 |
第5章 web信息提取系统的实现 | 第43-53页 |
5.1 信息提取模块功能的实现 | 第43-45页 |
5.1.1 phantomJS的调试 | 第43-45页 |
5.1.2 phantomJS与服务器端的通信 | 第45页 |
5.2 信息标准化模块实现 | 第45页 |
5.3 图表模块实现 | 第45-50页 |
5.4 系统实现结果 | 第50-53页 |
第6章 总结和展望 | 第53-55页 |
6.1 本文完成的工作 | 第53页 |
6.2 研究展望 | 第53-55页 |
参考文献 | 第55-57页 |
附录: 攻读硕士学位期间撰写的论文 | 第57-58页 |
致谢 | 第58页 |