网站数据的提取方法的研究

摘要	第5-6页
Abstract	第6-7页
第1章绪论	第9-13页
1.1 研究背景和意义	第9-10页
1.2 国内外研究现状	第10-11页
1.3 研究内容	第11-12页
1.4 本文组织结构	第12-13页
第2章相关技术	第13-22页
2.1 html和xml	第13-15页
2.2 url和http	第15-18页
2.3 dom方法	第18-19页
2.4 爬虫	第19-22页
第3章几种web信息获取应用	第22-30页
3.1 web apis	第22-24页
3.2 RSS	第24-26页
3.3 搜索引擎	第26-30页
第4章 web信息提取系统的设计	第30-43页
4.1 实验目标	第31页
4.2 系统开发环境	第31页
4.3 系统整体工作流程	第31-32页
4.4 phantomJS+php整合	第32-37页
4.5 模块设计	第37-42页
4.5.1 信息提取模块	第38-39页
4.5.2 信息标准化模块	第39-41页
4.5.3 图表模块	第41-42页
4.6 数据库的设计	第42-43页
第5章 web信息提取系统的实现	第43-53页
5.1 信息提取模块功能的实现	第43-45页
5.1.1 phantomJS的调试	第43-45页
5.1.2 phantomJS与服务器端的通信	第45页
5.2 信息标准化模块实现	第45页
5.3 图表模块实现	第45-50页
5.4 系统实现结果	第50-53页
第6章总结和展望	第53-55页
6.1 本文完成的工作	第53页
6.2 研究展望	第53-55页
参考文献	第55-57页
附录: 攻读硕士学位期间撰写的论文	第57-58页
致谢	第58页