Web信息采集技术研究与实现
| 摘要 | 第1-6页 |
| ABSTRACT | 第6-10页 |
| 第一章 绪论 | 第10-15页 |
| ·课题来源 | 第10页 |
| ·研究背景 | 第10-11页 |
| ·信息采集国内外研究概况 | 第11-13页 |
| ·本文主要研究内容 | 第13-14页 |
| ·论文的框架结构 | 第14-15页 |
| 第二章 WEB 信息采集技术 | 第15-21页 |
| ·WEB 信息采集基本概念 | 第15页 |
| ·HTML 页面结构分析 | 第15-16页 |
| ·利用HTML 标记的分布规律分析页面布局 | 第15-16页 |
| ·利用DOM 树分析页面布局 | 第16页 |
| ·利用页面视觉特征分析页面布局 | 第16页 |
| ·WEB 主题属性 | 第16页 |
| ·初始URL 集 | 第16页 |
| ·信息采集面临的问题 | 第16-17页 |
| ·配置模板技术 | 第17-18页 |
| ·URL 解析 | 第17页 |
| ·页面数据类型 | 第17页 |
| ·正则表达式 | 第17-18页 |
| ·数据处理方式 | 第18-20页 |
| ·数据显示 | 第18页 |
| ·数据存储 | 第18页 |
| ·数据备份 | 第18页 |
| ·数据统计 | 第18-20页 |
| ·本章小节 | 第20-21页 |
| 第三章 WEB 信息采集策略研究与设计 | 第21-26页 |
| ·WEB 信息采集模块的架构设计 | 第21-24页 |
| ·信息采集算法 | 第22-24页 |
| ·配置模块的设计 | 第24-26页 |
| ·配置模板定义 | 第24页 |
| ·配置模板参数说明 | 第24-25页 |
| ·配置模板实例化规则 | 第25-26页 |
| 第四章 信息定制系统原型设计与实现 | 第26-55页 |
| ·系统设计目标 | 第26页 |
| ·系统的架构设计 | 第26-31页 |
| ·信息采集器 | 第28页 |
| ·数据源 | 第28页 |
| ·数据库服务器 | 第28-29页 |
| ·客户端软件 | 第29-30页 |
| ·Web 应用服务器 | 第30-31页 |
| ·信息采集模块的设计与实现 | 第31-41页 |
| ·流程设计 | 第32-36页 |
| ·类的设计 | 第36-41页 |
| ·定制信息模块设计与实现 | 第41-44页 |
| ·流程设计 | 第41页 |
| ·类的设计 | 第41-44页 |
| ·配置模板模块设计 | 第44-48页 |
| ·流程设计 | 第44页 |
| ·类的设计 | 第44-48页 |
| ·数据统计模块的设计与实现 | 第48-54页 |
| ·统计量流程设计 | 第48-50页 |
| ·统计图功能设计 | 第50-52页 |
| ·类的设计 | 第52-54页 |
| ·本章小节 | 第54-55页 |
| 第五章 系统测试与评价 | 第55-65页 |
| ·测试环境 | 第55-56页 |
| ·服务器配置 | 第55页 |
| ·客户端配置 | 第55-56页 |
| ·测试项目与结果 | 第56-63页 |
| ·本章小结 | 第63-65页 |
| 总结和展望 | 第65-67页 |
| 参考文献 | 第67-69页 |
| 攻读硕士学位期间取得的研究成果 | 第69-70页 |
| 致谢 | 第70页 |