Web信息采集技术研究与实现
摘要 | 第1-6页 |
ABSTRACT | 第6-10页 |
第一章 绪论 | 第10-15页 |
·课题来源 | 第10页 |
·研究背景 | 第10-11页 |
·信息采集国内外研究概况 | 第11-13页 |
·本文主要研究内容 | 第13-14页 |
·论文的框架结构 | 第14-15页 |
第二章 WEB 信息采集技术 | 第15-21页 |
·WEB 信息采集基本概念 | 第15页 |
·HTML 页面结构分析 | 第15-16页 |
·利用HTML 标记的分布规律分析页面布局 | 第15-16页 |
·利用DOM 树分析页面布局 | 第16页 |
·利用页面视觉特征分析页面布局 | 第16页 |
·WEB 主题属性 | 第16页 |
·初始URL 集 | 第16页 |
·信息采集面临的问题 | 第16-17页 |
·配置模板技术 | 第17-18页 |
·URL 解析 | 第17页 |
·页面数据类型 | 第17页 |
·正则表达式 | 第17-18页 |
·数据处理方式 | 第18-20页 |
·数据显示 | 第18页 |
·数据存储 | 第18页 |
·数据备份 | 第18页 |
·数据统计 | 第18-20页 |
·本章小节 | 第20-21页 |
第三章 WEB 信息采集策略研究与设计 | 第21-26页 |
·WEB 信息采集模块的架构设计 | 第21-24页 |
·信息采集算法 | 第22-24页 |
·配置模块的设计 | 第24-26页 |
·配置模板定义 | 第24页 |
·配置模板参数说明 | 第24-25页 |
·配置模板实例化规则 | 第25-26页 |
第四章 信息定制系统原型设计与实现 | 第26-55页 |
·系统设计目标 | 第26页 |
·系统的架构设计 | 第26-31页 |
·信息采集器 | 第28页 |
·数据源 | 第28页 |
·数据库服务器 | 第28-29页 |
·客户端软件 | 第29-30页 |
·Web 应用服务器 | 第30-31页 |
·信息采集模块的设计与实现 | 第31-41页 |
·流程设计 | 第32-36页 |
·类的设计 | 第36-41页 |
·定制信息模块设计与实现 | 第41-44页 |
·流程设计 | 第41页 |
·类的设计 | 第41-44页 |
·配置模板模块设计 | 第44-48页 |
·流程设计 | 第44页 |
·类的设计 | 第44-48页 |
·数据统计模块的设计与实现 | 第48-54页 |
·统计量流程设计 | 第48-50页 |
·统计图功能设计 | 第50-52页 |
·类的设计 | 第52-54页 |
·本章小节 | 第54-55页 |
第五章 系统测试与评价 | 第55-65页 |
·测试环境 | 第55-56页 |
·服务器配置 | 第55页 |
·客户端配置 | 第55-56页 |
·测试项目与结果 | 第56-63页 |
·本章小结 | 第63-65页 |
总结和展望 | 第65-67页 |
参考文献 | 第67-69页 |
攻读硕士学位期间取得的研究成果 | 第69-70页 |
致谢 | 第70页 |