首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

开放存取期刊论文自动采集方法的研究

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-16页
   ·课题背景及意义第10-11页
   ·国内外研究现状第11-13页
     ·OA 资源利用与发展现状第11-12页
     ·Web 信息资源采集研究现状第12-13页
   ·本文的主要研究内容第13-14页
   ·本文组织结构第14-16页
第2章 基础知识和相关技术第16-26页
   ·HTML 基础第16-19页
     ·HTML 简介第16页
     ·HTML DOM 树第16-18页
     ·HTML 解析工具的介绍第18-19页
   ·HTTP 协议分析第19-20页
     ·HTTP 协议概述第19页
     ·HTTP 协议报头信息第19-20页
   ·网络爬虫技术介绍第20-22页
   ·Web 信息抽取技术第22-25页
   ·本章小结第25-26页
第3章 OA 期刊论文自动采集框架的设计第26-38页
   ·OA 期刊论文自动采集框架第26-30页
     ·采集系统的总体架构第26-27页
     ·系统总体模块第27-28页
     ·系统工作流程第28-29页
     ·系统的性能指标及工作原理第29-30页
   ·采集系统中的主要模块及关键问题第30-36页
     ·页面更新检测模块第30-32页
     ·论文采集模块第32-35页
     ·采集系统中的关键问题第35-36页
   ·本章小结第36-38页
第4章 OA 期刊卷期目录链接的提取方法第38-49页
   ·问题描述第38-39页
   ·问题解决方法第39页
   ·基于网页原子分割和内容块聚类的网页分块方法第39-43页
     ·网页的原子分割第39-41页
     ·原子内容块聚类第41-43页
   ·卷期目录链接块的识别算法第43-47页
     ·相关定义第43-44页
     ·链接文本相似度的计算第44页
     ·Bayes 后验概率的计算第44-46页
     ·卷期目录链接的识别算法第46-47页
   ·本章小结第47-49页
第5章 实验验证与分析第49-58页
   ·实验环境的搭建第49-51页
     ·系统环境的配置第49-50页
     ·系统整体界面第50-51页
     ·OA 期刊站点服务注册第51页
   ·实验数据来源及评价标准第51-52页
     ·实验数据来源第51页
     ·实验评价标准第51-52页
   ·卷期目录链接提取方法的验证第52-54页
     ·网页分块算法的对比分析第52-53页
     ·卷期目录链接识别和提取算法的验证第53-54页
   ·自动采集系统性能的分析第54-57页
   ·本章小结第57-58页
结论第58-60页
参考文献第60-64页
攻读硕士学位期间承担的科研任务与主要成果第64-65页
致谢第65-66页
作者简介第66页

论文共66页,点击 下载论文
上一篇:基于三网融合的智能型家庭网关的研究与实现
下一篇:基于统计分析的DDoS攻击检测的研究