首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--自动化系统论文--数据处理、数据处理系统论文

Web信息采集系统设计与实现

摘要第1-7页
Abstract第7-10页
第1章 绪论第10-15页
   ·研究背景第10-11页
   ·国内外研究现状第11-13页
     ·Web信息抽取技术研究现状第11-12页
     ·Web信息采集技术研究现状第12-13页
   ·研究内容第13-14页
   ·论文组织结构第14-15页
第2章 相关技术研究第15-24页
   ·信息抽取相关技术第15-19页
     ·HTML页面构成分析第15-16页
     ·DOM树第16-17页
     ·Jsoup解析器第17-19页
   ·Web信息采集的工作原理第19-20页
   ·网页结构分析第20-21页
   ·开发相关技术第21-23页
     ·SSH框架第21-23页
     ·jQuery第23页
   ·本章小结第23-24页
第3章 系统需求分析与总体设计第24-36页
   ·系统需求分析第24-32页
     ·需求概述第24-25页
     ·功能需求第25-31页
     ·非功能需求第31-32页
     ·领域建模第32页
   ·系统总体设计第32-33页
   ·数据库设计第33-35页
   ·系统开发环境第35页
   ·本章小结第35-36页
第4章 采集配置子系统的设计与实现第36-52页
   ·可视化抽取规则的生成第36-43页
     ·抽取规则的设计第36-38页
     ·抽取规则的生成第38-40页
     ·内嵌浏览器的设计第40-43页
   ·正文去噪第43-45页
     ·噪音信息分析第43页
     ·基于规则定制的正文去噪第43-45页
   ·具体实现第45-48页
   ·采集配置子系统测试第48-51页
   ·本章小结第51-52页
第5章 采集子系统设计与实现第52-70页
   ·采集子系统总体设计第52-56页
     ·单个站点采集工作流程设计第52-53页
     ·基于多线程的信息采集设计第53-56页
   ·系统关键点设计第56-63页
     ·Socket通信机制第56-58页
     ·动态采集策略第58-59页
     ·数据库连接池第59-60页
     ·信息抽取第60-62页
     ·文章去重第62-63页
   ·采集子系统实现第63-68页
     ·列表解析模块第63-64页
     ·文章解析模块第64-65页
     ·文章存储模块第65-66页
     ·系统调度模块第66-68页
   ·采集子系统测试第68-69页
   ·本章小结第69-70页
总结与展望第70-71页
致谢第71-72页
参考文献第72-76页
攻读硕士学位期间发表的论文及科研成果第76页

论文共76页,点击 下载论文
上一篇:基于协方差的选择性聚类集成研究
下一篇:基于超声波的管道障碍物检测与定位