首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--自动化系统论文--数据处理、数据处理系统论文

基于新闻和论坛的信息采集系统的设计与实现

目录第1-6页
摘要第6-7页
ABSTRACT第7-9页
第一章 绪论第9-13页
   ·课题的研究背景第9页
   ·信息采集的研究现状第9-11页
     ·信息采集概述第9-10页
     ·Web 信息采集技术的分类第10-11页
     ·国内外研究现状第11页
   ·系统设计的目的和意义第11-12页
   ·论文的组织结构第12-13页
第二章 信息采集关键技术研究第13-21页
   ·信息采集的基本原理第13页
   ·爬虫技术第13-15页
     ·通用网络爬虫第13-14页
     ·聚焦网络爬虫第14-15页
     ·深度爬虫第15页
   ·代理服务器技术第15-16页
   ·网页去重技术第16-17页
   ·正则表达式第17页
   ·种子 URL 的提取和正规化处理第17-18页
   ·中文切词技术第18-19页
   ·本章小结第19-21页
第三章 需求分析第21-25页
   ·Web 信息采集面临的主要困难第21页
   ·系统目标和解决的问题第21-22页
   ·系统需求概述第22页
   ·系统需求分析第22-24页
     ·新闻的特点第22-23页
     ·论坛的特点第23-24页
   ·本章小结第24-25页
第四章 基于新闻和论坛的信息采集系统的设计第25-33页
   ·系统设计目标第25页
   ·系统概要设计第25-28页
     ·系统整体结构第25-27页
     ·具体流程设计第27-28页
   ·系统详细设计第28-31页
     ·系统登录模块第28页
     ·信息采集模块第28-29页
     ·数据处理模块第29-30页
     ·增删 URL 模块第30页
     ·关键数据库结构设计第30-31页
   ·环境要求第31-32页
   ·本章小结第32-33页
第五章 基于新闻和论坛的信息采集系统的实现第33-45页
   ·系统主要模块的实现第33-39页
     ·信息采集模块的实现第33-38页
     ·数据处理模块的实现第38-39页
     ·增删 URL 模块的实现第39页
   ·基于新闻和论坛的信息采集系统的演示过程第39-43页
   ·本章小结第43-45页
第六章 系统测试与分析第45-47页
   ·测试环境第45页
   ·测试集的选择第45页
   ·采集速度第45页
   ·采准率第45-46页
   ·本章小结第46-47页
第七章 总结与展望第47-48页
参考文献第48-50页
致谢第50页

论文共50页,点击 下载论文
上一篇:基于433MHz模块的远程抄表安全系统设计与实现
下一篇:基于单片机的温湿度控制系统的设计