首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

网络舆情系统中网络爬虫和报表生成子系统的设计与实现

摘要第1-6页
ABSTRACT第6-10页
第一章 引言第10-16页
   ·研究背景第10-11页
     ·网络舆情第10页
     ·网络爬虫第10-11页
     ·报表第11页
   ·国内外研究现状第11-15页
     ·网络舆情系统第11-12页
     ·聚焦网络爬虫第12-13页
     ·基于模板化的网络爬虫技术第13-14页
     ·报表生成第14-15页
   ·本文研究意义第15页
   ·本文结构第15-16页
第二章 相关技术第16-24页
   ·传统爬虫技术第16-17页
     ·基本框架第16页
     ·工作原理第16-17页
   ·WORD 报表的生成第17-21页
     ·Word 文档的生成第17-21页
     ·Word 文档的写入及格式控制第21页
   ·数据库管理第21-22页
   ·JSP 页面制作第22-23页
     ·JSP 页面与数据库连接第22-23页
     ·JSP 与 JavaScript 参数传递与接收第23页
   ·本章小结第23-24页
第三章 模板第24-37页
   ·模板简介第24-25页
   ·模板的组织形式及使用第25-33页
     ·配置文件第25-26页
     ·模板库第26-29页
     ·数据库表第29-30页
     ·网站分析第30-33页
   ·模板的设计与实现第33-35页
     ·模板的设计第33-34页
     ·模板的实现第34-35页
   ·模板还存在的问题第35-36页
   ·本章小结第36-37页
第四章 网络爬虫子系统的设计与实现第37-57页
   ·系统的组织结构第37-38页
   ·模板匹配模块及其原理第38-43页
   ·网页抓取模块第43-45页
   ·网页解析模块第45-46页
   ·数据库管理模块第46页
   ·HBASE写入模块第46-47页
   ·异常模块第47-49页
   ·系统的工作流程第49页
   ·网络爬虫子系统测试第49-55页
     ·基于模板化网络爬虫技术的 Web 网页信息抽取系统测试第49-51页
     ·测试结果分析第51-55页
     ·结论第55页
   ·本章小结第55-57页
第五章 报表生成子系统的设计与实现第57-75页
   ·系统的总体框架第57-59页
     ·总体框架结构第57页
     ·子模块结构第57-59页
   ·报表生成子系统的工作流程第59-60页
     ·客户端提交搜索所需 ID,系统获取 ID第59-60页
     ·根据 ID 从 Lucene 索引检索文档标题、内容第60页
     ·根据检索所得文档标题、内容生成报表第60页
   ·报表生成设计与实现第60-65页
     ·Word 文档的自动生成和存储第60-63页
     ·写入内容的格式控制第63页
     ·内容的写入第63-65页
   ·数据库设计与实现第65-67页
     ·Oracle 数据库的连接与检索输出第65-66页
     ·Lucene 索引的文档检索第66-67页
   ·实例测试与分析第67-74页
     ·Lucene 检索模块测试第68-69页
     ·报表生成模块测试第69-71页
     ·系统整体测试结果及其分析第71-73页
     ·结论第73-74页
   ·本章小结第74-75页
第六章 结论第75-77页
致谢第77-78页
参考文献第78-80页

论文共80页,点击 下载论文
上一篇:基于自适应遗传算法的入侵检测系统的研究
下一篇:基于JSP的校园管理网站系统的设计与开发