基于网络爬虫的基金信息抽取与分析平台
| 摘要 | 第1-6页 |
| Abstract | 第6-9页 |
| 第一章 绪论 | 第9-13页 |
| ·课题的研究目的与意义 | 第9页 |
| ·国内外研究现状 | 第9-11页 |
| ·课题的主要研究内容 | 第11-12页 |
| ·论文结构安排 | 第12-13页 |
| 第二章 平台背景与相关技术介绍 | 第13-31页 |
| ·基金数据业务背景 | 第13-14页 |
| ·系统后台技术理论概述 | 第14-18页 |
| ·网络爬虫简介 | 第14-15页 |
| ·信息抽取介绍 | 第15-18页 |
| ·系统前台技术理论概述 | 第18-30页 |
| ·J2EE 关键技术 | 第18-26页 |
| ·报表现状介绍 | 第26-30页 |
| ·本章小结 | 第30-31页 |
| 第三章 系统需求分析与架构设计 | 第31-37页 |
| ·系统功能需求分析 | 第31-33页 |
| ·系统非功能需求 | 第33页 |
| ·系统整体架构 | 第33-35页 |
| ·系统工作流程 | 第35-36页 |
| ·本章小结 | 第36-37页 |
| 第四章 系统详细设计 | 第37-54页 |
| ·网络爬虫抓取 | 第37-41页 |
| ·Heritrix 爬虫介绍 | 第37-39页 |
| ·抓取规则设定 | 第39-40页 |
| ·网页抓取过程 | 第40-41页 |
| ·网页信息的抽取 | 第41-43页 |
| ·半结构化信息的抽取 | 第41-42页 |
| ·HTMLParser 抽取应用 | 第42页 |
| ·系统网页数据抽取规则库 | 第42-43页 |
| ·J2EE 架构设计 | 第43-50页 |
| ·J2EE 框架 | 第43-46页 |
| ·平台的J2EE 整合应用 | 第46-50页 |
| ·报表的自动生成 | 第50-53页 |
| ·报表的简介 | 第50-52页 |
| ·系统报表的应用 | 第52-53页 |
| ·本章小结 | 第53-54页 |
| 第五章 系统实现与测试 | 第54-68页 |
| ·系统的开发环境 | 第54页 |
| ·系统实现 | 第54-64页 |
| ·网络爬虫扩展实现 | 第54-56页 |
| ·网页数据抽取实现 | 第56-58页 |
| ·报表的实现 | 第58-64页 |
| ·系统测试 | 第64-67页 |
| ·本章小结 | 第67-68页 |
| 第六章 总结与展望 | 第68-70页 |
| ·课题工作总结 | 第68页 |
| ·下一步的工作展望 | 第68-70页 |
| 参考文献 | 第70-72页 |
| 致谢 | 第72页 |