面向实证方法的互联网数据提取系统研究
摘要 | 第5-6页 |
ABSTRACT | 第6-7页 |
缩略语对照表 | 第10-13页 |
第一章 绪论 | 第13-21页 |
1.1 研究背景 | 第13-16页 |
1.1.1 管理研究的基本要素 | 第13-14页 |
1.1.2 数据观察与收集过程 | 第14-15页 |
1.1.3 大数据时代下的管理研究 | 第15-16页 |
1.2 研究的目的和意义 | 第16-18页 |
1.2.1 研究目的 | 第16-17页 |
1.2.2 研究意义 | 第17-18页 |
1.3 研究方法与论文架构 | 第18-21页 |
第二章 文献综述 | 第21-27页 |
2.1 基于互联网数据的管理研究论文分析 | 第21-22页 |
2.2 互联网数据获取研究现状 | 第22-26页 |
2.2.1 基于互联网数据研究的基本现状 | 第22页 |
2.2.2 目标Web页面获取 | 第22-23页 |
2.2.3 页面内容获取 | 第23-26页 |
2.3 数据获取框架的设计思路 | 第26-27页 |
第三章 研究对象分析 | 第27-33页 |
3.1 实证研究的数据观察与搜集 | 第27-28页 |
3.2 基于互联网数据收集的无干扰研究 | 第28-29页 |
3.3 互联网数据分析 | 第29-33页 |
3.3.1 互联网数据类型 | 第29-30页 |
3.3.2 各数据类型的特点 | 第30-33页 |
第四章 数据爬取框架的分析与设计 | 第33-47页 |
4.1 基本需求分析 | 第33-34页 |
4.1.1 相关概念阐述 | 第33页 |
4.1.2 框架设计目标 | 第33-34页 |
4.2 框架结构的分析与设计 | 第34-36页 |
4.2.1 框架功能层次分析 | 第34页 |
4.2.2 框架执行流程分析 | 第34-36页 |
4.2.3 框架结构设计方案 | 第36页 |
4.3 数据提取策略的分析与设计 | 第36-47页 |
4.3.1 数据提取策略的理论基础 | 第36-37页 |
4.3.2 线性数据提取策略 | 第37-38页 |
4.3.3 树形结构数据提取策略 | 第38-41页 |
4.3.4 非确定结构数据提取策略 | 第41-47页 |
第五章 爬取框架实现 | 第47-57页 |
5.1 爬取框架技术选型 | 第47-49页 |
5.1.1 框架软件选型 | 第47-48页 |
5.1.2 硬件平台 | 第48-49页 |
5.2 核心接口与工具库的实现 | 第49-50页 |
5.3 Web平台的实现 | 第50-52页 |
5.4 执行引擎的实现 | 第52-54页 |
5.5 框架总体实现架构 | 第54-57页 |
第六章 框架应用实例 | 第57-65页 |
6.1 拍拍贷——从拍拍贷抓取数据 | 第57-60页 |
6.1.1 研究简介 | 第57页 |
6.1.2 数据爬取流程阐述 | 第57-59页 |
6.1.3 研究基本结论 | 第59-60页 |
6.2 知识结构匹配研究——从领英网抓取数据 | 第60-64页 |
6.2.1 研究简介 | 第60页 |
6.2.2 数据爬取流程阐述 | 第60-63页 |
6.2.3 研究基本结论 | 第63-64页 |
6.3 框架应用小节 | 第64-65页 |
第七章 总结与展望 | 第65-67页 |
7.1 工作总结 | 第65页 |
7.2 研究展望 | 第65-67页 |
参考文献 | 第67-71页 |
致谢 | 第71-73页 |
作者简介 | 第73-74页 |