股票网络论坛信息的自动获取及应用系统研究
摘要 | 第5-6页 |
ABSTRACT | 第6页 |
第一章 引言 | 第7-9页 |
1.1 本文研究的背景 | 第7页 |
1.2 本文研究的内容 | 第7-8页 |
1.3 本文研究的可行性 | 第8页 |
1.4 本文研究的创新性 | 第8-9页 |
第二章 相关技术介绍 | 第9-14页 |
2.1 网络爬虫技术 | 第9页 |
2.2 Web信息提取技术 | 第9-10页 |
2.3 其他涉及技术 | 第10-14页 |
2.3.1 JMX | 第10-11页 |
2.3.2 JMS及ActiveMQ | 第11页 |
2.3.3 Lucene | 第11-12页 |
2.3.4 ExtJs | 第12-14页 |
第三章 系统分析与设计 | 第14-21页 |
3.1 系统目标 | 第14-15页 |
3.2 系统整体介绍 | 第15页 |
3.3 需求分析 | 第15-16页 |
3.3.1 股票论坛信息抓取系统需求分析 | 第15页 |
3.3.2 股票论坛分析系统需求分析 | 第15-16页 |
3.4 系统架构 | 第16-18页 |
3.4.1 股票论坛信息抓取系统架构 | 第16-17页 |
3.4.2 股票论坛分析系统架构 | 第17-18页 |
3.5 开发环境规定 | 第18页 |
3.6 数据库设计 | 第18-21页 |
第四章 信息获取的实现方法 | 第21-37页 |
4.1 项目结构 | 第21-22页 |
4.2 信息抓取算法的实现 | 第22-25页 |
4.3 线程分配及调度 | 第25-30页 |
4.3.1 主题线程 | 第25-27页 |
4.3.2 帖子线程 | 第27-28页 |
4.3.3 调度线程 | 第28-29页 |
4.3.4 监控线程 | 第29-30页 |
4.4 增量抓取处理 | 第30-31页 |
4.5 数据整理 | 第31-35页 |
4.5.1 存储过程 | 第31-34页 |
4.5.2 创建索引 | 第34-35页 |
4.6 系统性能分析测试 | 第35-37页 |
第五章 信息获取的客户端设计 | 第37-45页 |
5.1 客户端项目结构 | 第37页 |
5.2 客户端与服务器端的通信 | 第37-41页 |
5.3 客户端主要功能 | 第41-43页 |
5.3.1 参数配置 | 第41-42页 |
5.3.2 股票选择 | 第42页 |
5.3.3 系统状态控制 | 第42-43页 |
5.4 多客户端处理机制 | 第43-45页 |
第六章 论坛信息的应用开发 | 第45-50页 |
6.1 详细设计及系统功能实现 | 第45-50页 |
6.1.1 搜索模块 | 第45-47页 |
6.1.2 关注度分析模块 | 第47-50页 |
第七章 结论 | 第50-52页 |
参考文献 | 第52-54页 |
致谢 | 第54-55页 |