首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

中文网页自动采集与分类系统设计与实现

摘要第1-5页
ABSTRACT第5-9页
第一章 引言第9-14页
   ·课题背景及研究现状第9-12页
     ·课题的背景及研究目的第9-10页
     ·课题的国内外研究现状第10-12页
   ·课题任务第12页
   ·论文结构第12-14页
第二章 网页采集与分类相关技术介绍第14-31页
   ·网页爬虫技术第14-19页
     ·通用网络爬虫第14-16页
     ·聚焦网络爬虫第16-18页
     ·深度网络爬虫第18-19页
   ·中文网页信息抽取技术第19-21页
     ·中文网页特点分析第19-20页
     ·信息抽取关键技术第20-21页
     ·信息抽取评价标准第21页
   ·网页去重技术第21-23页
   ·中文文本分词技术第23-27页
     ·中文分词概述第23-24页
     ·中文分词方法第24-27页
   ·特征提取技术第27-30页
     ·特征提取概述第27-28页
     ·特征提取方法第28-30页
   ·网页分类技术概述第30页
   ·本章小结第30-31页
第三章 网页采集与分类系统设计第31-44页
   ·系统需求分析第31-32页
   ·系统概要设计第32-34页
     ·系统总体框架设计第32页
     ·采集系统结构设计第32-33页
     ·分类系统结构设计第33-34页
   ·系统功能模块设计第34-36页
     ·系统总体模块设计第34-35页
     ·模块功能介绍第35-36页
   ·系统流程设计第36-38页
     ·采集系统流程设计设计第36-37页
     ·分类系统流程设计第37-38页
   ·系统逻辑设计第38-40页
     ·采集系统类图第38-39页
     ·分类系统类图第39页
     ·分类处理时序图第39-40页
   ·系统数据库设计第40-43页
   ·本章小结第43-44页
第四章 网页采集与分类系统实现第44-61页
   ·页面采集模块实现第44-45页
   ·网页信息抽取模块实现第45-46页
   ·网页去重模块实现第46-48页
   ·中文分词模块实现第48-50页
   ·特征向量提取模块实现第50-55页
   ·训练语料库模块实现第55-56页
   ·分类模块实现第56-60页
     ·几种典型的分类算法第56-58页
     ·KNN算法实现分类模块第58-60页
   ·系统开发环境配置第60页
   ·本章小结第60-61页
第五章 网页采集与分类系统测试第61-68页
   ·系统运行界面第61-64页
   ·实验评测标准第64-65页
   ·实验结果分析第65-67页
   ·本章小结第67-68页
第六章 结束语第68-69页
   ·论文工作总结第68页
   ·问题和展望第68-69页
参考文献第69-71页
致谢第71页

论文共71页,点击 下载论文
上一篇:网页内容获取及基于意图的聚类
下一篇:基于Cookie的跨域单点登录系统的设计与实现