首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于Web信息获取的新闻数据分析研究

摘要第1-7页
Abstract第7-10页
第1章 绪论第10-14页
   ·引言第10-11页
   ·背景和意义第11-12页
   ·本文研究内容第12-14页
第2章 信息检索相关技术第14-21页
   ·信息检索第14-16页
     ·信息检索简价第14页
     ·信息检索原理第14-16页
   ·搜索技术第16-21页
     ·Lucene技术第16-17页
     ·Nutch技术第17-19页
     ·Heritrix技术第19-21页
第3章 新闻分析整体构架第21-27页
   ·新闻分析的系统结构第21-23页
     ·信息搜集第21-22页
     ·新闻预处理第22-23页
     ·查询、分发功能第23页
   ·新闻服务器的系统设计第23-26页
     ·数据源获取第24-25页
     ·建立索引第25页
     ·功能实现第25-26页
   ·系统设计的目标第26-27页
第4章 新闻分析引擎的设计第27-51页
   ·数据集第27-30页
     ·外汇新闻网站结构分析第27-28页
     ·Heritrix工作流程图第28-29页
     ·数据集存储结构第29-30页
   ·新闻内容分析第30-38页
     ·新闻分析功能需求第30-31页
     ·新闻分析实现原理第31-32页
     ·新闻分析系统结构第32-34页
     ·新闻分析流程设计第34-36页
     ·新闻内容文本分词算法第36-37页
     ·新闻内容文本分词流程第37-38页
   ·新闻搜索第38-44页
     ·新闻索引功能需求第39-40页
     ·新闻索引的实现原理第40-41页
     ·新闻索引流程设计第41-42页
     ·新闻检索技术分析第42-43页
     ·新闻检索功能需求第43页
     ·新闻检索程序设计第43-44页
   ·新闻转发第44-45页
     ·新闻搜索及转发功能需求第44-45页
   ·关键类设计第45-49页
   ·数据库设计第49-51页
第5章 新闻分析引擎的实现与技术难点第51-67页
   ·系统架构第51页
     ·服务器设计图第51页
   ·Server实现第51-62页
     ·新闻抓取模块第51-53页
     ·lucene的配置及使用第53-54页
     ·新闻分析模块第54-56页
     ·新闻搜索处理模块第56-59页
     ·新闻转发模块第59-60页
     ·用户登录模块第60-62页
   ·TCP数据传输格式第62-63页
     ·用户登录信息第62页
     ·搜索内容第62页
     ·新闻搜索返回第62-63页
   ·Client实现第63-67页
     ·Client登录模块第63页
     ·Client主界面第63-65页
     ·Client与服务器通信模块第65-67页
第6章 总结与展望第67-69页
   ·本文总结第67页
   ·展望下一步工作第67-69页
参考文献第69-72页
致谢第72页

论文共72页,点击 下载论文
上一篇:“九三学社”天津市委员会网站管理系统的设计与实现
下一篇:统一身份认证在数字化校园中的作用与实现