首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

网络表格的实体列发现与标识

致谢第5-6页
摘要第6-7页
ABSTRACT第7-8页
目录第9-11页
1 绪论第11-17页
    1.1 研究背景和意义第11-12页
    1.2 国内外研究现状第12-14页
        1.2.1 网络表格的列标签恢复技术第13页
        1.2.2 网络表格的实体列发现第13-14页
    1.3 本文完成的工作第14-15页
    1.4 本文的组织结构第15-17页
2 网络表格语义恢复知识概述第17-26页
    2.1 网络表格第17-19页
        2.1.1 网络表格概述第17-18页
        2.1.2 实体列第18-19页
    2.2 本体库的选择第19-24页
        2.2.1 Freebase第20-22页
        2.2.2 Probase第22-24页
    2.3 实体列发现知识简述第24-26页
        2.3.1 贝叶斯定理第24页
        2.3.2 PageRank算法第24-26页
3 基于语义重要性的实体列发现与标识第26-47页
    3.1 问题描述与解决方案第26-32页
        3.1.1 问题描述第26-29页
        3.1.2 相关概念和定义第29-30页
        3.1.3 解决方案第30-32页
    3.2 基于概念重要度的列标签恢复第32-36页
        3.2.1 列标签的概念化第32-34页
        3.2.2 基于概念重要度的列标签恢复第34-36页
    3.3 基于结点语义重要性的最强实体列发现算法第36-44页
        3.3.1 实体列结点的语义重要性分析第36-38页
        3.3.2 列与列间的属性依赖关系第38-40页
        3.3.3 基于PageRank思想的结点重要性算法第40-44页
    3.4 基于分裂的实体列发现算法第44-47页
4 实验结果与分析第47-61页
    4.1 实验设置第47-48页
        4.1.1 实验环境第47页
        4.1.2 实验数据集第47-48页
        4.1.3 实验的评估指标第48页
    4.2 基于概念重要度的列标签恢复算法实验评估第48-52页
        4.2.1 评估标准设计第48-50页
        4.2.2 实验过程以及结果分析第50-52页
    4.3 基于PageRank思想的最强实体列发现实验分析与评估第52-58页
        4.3.1 评估标准设计第53-54页
        4.3.2 实验过程以及结果分析第54-58页
    4.4 基于分裂思想的多实体列发现第58-61页
        4.4.1 评估标准设计第58-59页
        4.4.2 实验过程以及结果分析第59-61页
5 总结与展望第61-63页
    5.1 本文的工作总结第61-62页
    5.2 进一步研究工作与展望第62-63页
参考文献第63-66页
作者简历第66-68页
学位论文数据集第68页

论文共68页,点击 下载论文
上一篇:晶硅组件热斑效应的分析
下一篇:广告投放数据管理平台的设计与实现