首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于同义实体识别的Web数据集成

致谢第7-8页
摘要第8-9页
ABSTRACT第9页
第一章 绪论第14-19页
    1.1 课题研究背景第14-15页
    1.2 国内外研究现状第15-18页
        1.2.1 数据集成概要第15-17页
        1.2.2 同义实体识别概要第17-18页
    1.3 本文主要研究内容第18页
    1.4 论文结构第18-19页
第二章 相关技术概述第19-35页
    2.1 网页采集技术第19-24页
        2.1.1 网络爬虫概要第19-20页
        2.1.2 分布式爬虫Nutch第20-24页
    2.2 信息抽取技术第24-27页
        2.2.1 信息抽取技术概要第24-25页
        2.2.2 信息抽取工具Jsoup第25-27页
    2.3 数据清洗第27-29页
    2.4 同义实体识别第29-31页
    2.5 SOA与Web Service第31-34页
        2.5.1 SOA第31-32页
        2.5.2 Web Service第32-34页
    2.6 本章小结第34-35页
第三章 基于搜索引擎的同义实体识别第35-45页
    3.1 相关概念第35-36页
    3.2 基于搜索引擎的相似度计算第36-37页
    3.3 基于搜索引擎的同义实体识别第37-39页
    3.4 实验及评价标准第39-44页
        3.4.1 实验数据集第39-40页
        3.4.2 评价标准第40页
        3.4.3 实验结果第40-42页
        3.4.4 讨论第42-44页
    3.5 本章小结第44-45页
第四章 基于同义实体识别的Web数据融合系统第45-60页
    4.1 系统设计第45-46页
    4.2 数据资源层第46-51页
        4.2.1 数据采集模块第46-48页
        4.2.2 信息抽取模块第48-51页
    4.3 数据融合层第51-57页
        4.3.1 数据预处理模块第51-55页
        4.3.2 数据融合模块第55-57页
    4.4 数据服务层第57-59页
    4.5 本章小结第59-60页
第五章 慧农农数据集成系统第60-75页
    5.1 系统架构第60-61页
    5.2 系统环境第61-62页
        5.2.1 硬件环境第61页
        5.2.2 存储平台层第61-62页
    5.3 数据采集与结构化第62-67页
        5.3.1 基于Nutch的分布式爬虫集群第62-63页
        5.3.2 数据建模第63-66页
        5.3.3 数据抽取第66-67页
    5.4 数据加工第67-70页
        5.4.1 数据清洗第67-68页
        5.4.2 数据融合第68-69页
        5.4.3 数据统计与分析第69-70页
    5.5 数据服务第70-74页
        5.5.1 接口访问方式第70-71页
        5.5.2 页面访问方式第71-74页
    5.6 本章小结第74-75页
第六章 总结与展望第75-77页
    6.1 本文总结第75页
    6.2 展望第75-77页
参考文献第77-81页
攻读硕士学位期间的学术活动及成果情况第81-82页

论文共82页,点击 下载论文
上一篇:Windows环境下虚拟化Android系统中NFC模块的移植与应用研究
下一篇:面向社交网络隐私保护的图像感知Hash研究