首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

深层网络数据源发现与查询结果抽取研究

摘要第1-7页
Abstract第7-11页
第1章 绪论第11-15页
   ·研究背景及意义第11-12页
   ·国内外研究现状第12-13页
   ·本文研究内容第13-14页
   ·组织结构第14-15页
第2章 相关理论与技术基础第15-20页
   ·查询接口第15页
   ·网络爬虫第15-16页
   ·数据源分类第16-18页
   ·网页结构相似度计算模型第18-20页
第3章 深层网络数据源的发现及方法改进第20-35页
   ·深层网络数据源发现框架第20-21页
   ·查询接口的筛选第21-25页
     ·概述第21-22页
     ·查询接口定义第22-23页
     ·基于规则的查询接口筛选第23-25页
   ·数据源分类方法的改进第25-35页
     ·传统数据源分类方法的不足第25-27页
     ·一种改进的数据源分类方法第27-30页
     ·改进方法的数据源分类过程第30-33页
     ·实验结果与分析第33-35页
第4章 网页信息抽取及新算法的应用第35-57页
   ·概述第35-36页
   ·网页预处理第36-39页
     ·网页文件的清洗第36-38页
     ·网页标签树的建立第38-39页
   ·一种新的网页标签树相似度算法第39-45页
     ·问题的提出第39-40页
     ·算法思想第40-44页
     ·算法描述第44-45页
     ·算法代价理论分析第45页
   ·基于新算法的网页数据区域识别第45-49页
   ·一种网页信息抽取的实例应用第49-53页
     ·实例页面特点分析第49-50页
     ·实例页面的信息抽取第50-52页
     ·信息抽取算法描述第52页
     ·抽取数据的存储第52-53页
   ·实验结果与分析第53-57页
     ·算法对网页相似程度衡量实验及结果分析第54-55页
     ·数据区域记录发现实验及结果分析第55-57页
第5章 深层网络数据集成框架设计与主要模块实现第57-65页
   ·深层网络数据集成框架设计第57-58页
   ·数据源发现模块的实现第58-62页
     ·概述第58-59页
     ·网页下载子模块的实现第59-60页
     ·查询接口子模块的实现第60页
     ·数据源分类子模块的实现第60-62页
   ·结果页面抽取模块的实现第62-65页
     ·数据区域子模块的实现第62-63页
     ·数据提取子模块的实现第63-65页
总结与展望第65-66页
 论文总结第65页
 进一步工作第65-66页
致谢第66-67页
参考文献第67-71页
攻读硕士学位期间发表的论文及科研成果第71页

论文共71页,点击 下载论文
上一篇:基于局部特征的人脸识别研究
下一篇:基于DAVINCI平台的运动物体捕捉系统研究