首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于本体演化的Deep Web数据抽取与注释

摘要第4-7页
ABSTRACT第7-9页
第1章 绪论第13-31页
    1.1 研究背景和意义第13-16页
    1.2 国内外研究现状第16-27页
        1.2.1 数据抽取第16-23页
        1.2.2 数据注释第23-27页
    1.3 基于本体演化的数据抽取和注释的工作框架图第27-28页
    1.4 本文的研究内容和章节安排第28-31页
第2章 初始本体的构造第31-55页
    2.1 引言第31-37页
        2.1.1 本体的定义第31-32页
        2.1.2 本体的分类第32页
        2.1.3 本体的描述语言第32-33页
        2.1.4 本体的构建方法与工具第33-37页
    2.2 本体的概念模型第37-39页
    2.3 查询接口属性抽取第39-44页
        2.3.1 相关定义第39页
        2.3.2 查询接口属性抽取第39-44页
    2.4 查询结果页面的实例抽取第44-46页
    2.5 初始本体的构造第46-48页
        2.5.1 WORD匹配第46-47页
        2.5.2 字符串匹配第47页
        2.5.3 初始本体创建第47-48页
    2.6 本体的解析第48-49页
    2.7 实验结果与分析第49-53页
        2.7.1 测试样本集第49页
        2.7.2 查询接口属性抽取算法评估第49-50页
        2.7.3 初始本体构造性能评价第50-53页
    2.8 本章小结第53-55页
第3章 基于本体的数据抽取第55-73页
    3.1 引言第55-56页
    3.2 识别数据记录区域第56-64页
        3.2.1 相关定义第56-57页
        3.2.2 创建DOM树第57-58页
        3.2.3 识别结点块第58-62页
        3.2.4 识别数据记录区域第62-64页
    3.3 数据记录的分割第64-66页
    3.4 数据记录的对齐第66-68页
    3.5 实验结果与分析第68-72页
        3.5.1 测试样本集第68-69页
        3.5.2 数据区域识别算法的性能评价第69-70页
        3.5.3 数据抽取性能的评价第70-72页
    3.6 本章小结第72-73页
第4章 基于本体的数据注释第73-91页
    4.1 引言第73-74页
    4.2 重复数据记录的识别第74-79页
        4.2.1 相关定义第74-75页
        4.2.2 基于距离函数的方法第75-76页
        4.2.3 基于机器学习的方法第76页
        4.2.4 重复记录识别工具第76-77页
        4.2.5 重复数据记录的识别第77-79页
    4.3 数据的注释第79-86页
        4.3.1 基于实例的匹配算法第79-80页
        4.3.2 KBFS搜索算法第80-82页
        4.3.3 数据的注释第82-86页
    4.4 实验结果与分析第86-88页
        4.4.1 重复数据记录识别算法的性能评价第86-87页
        4.4.2 数据注释算法的性能评价第87-88页
    4.5 本章小结第88-91页
第5章 本体演化在DEEP WEB中的应用第91-97页
    5.1 引言第91-93页
    5.2 本体的演化第93-94页
    5.3 实验结果与分析第94-96页
    5.4 本章小结第96-97页
第6章 总结与展望第97-99页
    6.1 总结第97-98页
    6.2 展望第98-99页
参考文献第99-113页
作者简介及在学期间所取得的科研成果第113-115页
致谢第115页

论文共115页,点击 下载论文
上一篇:双特异性抗肿瘤重组腺病毒对肝癌细胞及其模型动物的治疗作用研究
下一篇:无线网状网中的吞吐量分析与信道分配研究