首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向新闻领域的文本数据获取系统的设计与实现

摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-13页
   ·引言第9页
   ·文本数据获取系统的现状及其发展方向第9-11页
   ·课题的提出及意义第11页
   ·本论文的研究任务第11-12页
   ·论文的组织第12-13页
第二章 研究综述第13-19页
   ·J2EE技术的简介第13页
   ·J2EE关键技术第13-16页
     ·J2EE结构分析第13-15页
     ·对象持久化技术第15-16页
   ·文本分类概述第16页
   ·Web文本分类的重要意义第16页
   ·文本分类技术研究现状第16-18页
     ·国外文本分类研究现状第16-17页
     ·国内文本分类研究现状第17页
     ·中文Web文本分类研究第17-18页
   ·小结第18-19页
第三章 系统的需求分析第19-23页
   ·系统需求分析第19-22页
   ·各系统间的关系第22页
   ·小结第22-23页
第四章 面向新闻领域的文本数据获取系统的设计第23-41页
   ·系统的总体设计第23-26页
     ·系统的设计目标第23页
     ·系统的设计思路第23-24页
     ·系统的平台模式第24-25页
     ·系统的总体模块第25-26页
   ·系统的详细设计第26-35页
     ·新闻管理程序模块第26页
     ·主题管理模块第26页
     ·图片管理模块第26-27页
     ·网络爬虫模块第27-29页
     ·网页内容抽取模块第29-31页
     ·中文分词第31-33页
     ·文本特征提取第33-34页
     ·训练模块第34-35页
     ·分类模块第35页
   ·系统数据库设计第35-37页
     ·逻辑结构设计第35-36页
     ·核心表结构设计第36-37页
   ·系统核心类图设计第37-40页
     ·系统包图设计第37-38页
     ·爬虫模块的类图设计第38-39页
     ·网页内容提取的类图设计第39页
     ·文本特征提取类图设计第39-40页
   ·小结第40-41页
第五章 面向新闻领域的文本数据获取系统的实现和测试第41-48页
   ·系统开发环境第41页
   ·系统的具体实现第41-43页
     ·实现说明第41-42页
     ·中文分类的实现方案第42-43页
   ·系统测试第43-47页
     ·单元测试和JUnit框架第43-45页
     ·网络爬虫的测试及分析第45页
     ·网页内容提取的测试第45-46页
     ·新闻分类的测试第46-47页
   ·小结第47-48页
第六章 结束语第48-50页
   ·工作总结第48页
   ·下一步工作第48-50页
参考文献第50-52页
致谢第52-53页
攻读学位期间发表的学术论文第53页

论文共53页,点击 下载论文
上一篇:面向新闻领域的用户行为特征提取系统的设计与实现
下一篇:基于颜色聚类和连通域分析的视频文本提取方法