首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于中文百科的概念知识库构建

摘要第5-6页
Abstract第6-7页
第1章 绪论第13-17页
    1.1 课题背景第13-15页
    1.2 本文主要工作第15-16页
    1.3 本文组织结构第16-17页
第2章 国内外研究现状第17-26页
    2.1 现有的概念层次关系抽取方法第17-21页
        2.1.1 基于模式的方法第17-18页
        2.1.2 基于Harris假设的方法第18-20页
        2.1.3 基于结构化和半结构化数据方法第20页
        2.1.4 基于众包的方法第20-21页
    2.2 现有的属性值抽取方法第21-23页
        2.2.1 基于规则的方法第21-22页
        2.2.2 基于统计的机器学习方法第22页
        2.2.3 基于结构化和半结构化数据方法第22-23页
    2.3 自然语言处理工具第23-25页
        2.3.1 ICTCLAS第23-24页
        2.3.2 FudanNLP第24-25页
    2.4 网页URL去重第25页
        2.4.1 布隆过滤器第25页
    2.5 本章小结第25-26页
第3章 概念抽取第26-38页
    3.1 资源获取及预处理第26-27页
    3.2 同义词表的建立第27-30页
        3.2.1 词条同义词表第28-29页
        3.2.2 属性同义词表第29-30页
    3.3 类别属性的抽取第30-31页
    3.4 类别层次结构的构建第31-36页
        3.4.1 Boosting算法第32-34页
        3.4.2 类别上下位关系的抽取第34-36页
    3.5 词条与类别上下位关系的抽取第36-37页
        3.5.1 特征选择与模型训练第36-37页
        3.5.2 利用类别层次结构辅助判断第37页
    3.6 本章小结第37-38页
第4章 基于条件随机场的属性值抽取第38-51页
    4.1 属性值抽取概述第38-39页
    4.2 训练数据的确定第39-40页
    4.3 CRF++模型训练第40-49页
        4.3.1 CRF++第40-41页
        4.3.2 语料标注第41-45页
        4.3.3 特征模板第45-47页
        4.3.4 特征生成和选择第47-49页
        4.3.5 模型训练第49页
    4.4 抽取属性值第49-50页
    4.5 本章小结第50-51页
第5章 实验与分析第51-63页
    5.1 数据集第51-52页
    5.2 评测标准第52页
    5.3 层次结构构建实验第52-58页
        5.3.1 实验设计第52-53页
        5.3.2 实验效果比较第53-55页
        5.3.3 实验结果展示第55-58页
    5.4 属性值抽取实验第58-62页
        5.4.1 实验设计第58-59页
        5.4.2 实验结果与分析第59-62页
    5.5 本章小结第62-63页
第6章 总结与展望第63-64页
    6.1 总结第63页
    6.2 展望第63-64页
参考文献第64-68页
致谢第68-69页
作者简历第69页

论文共69页,点击 下载论文
上一篇:专题摘要自动生成技术研究
下一篇:基于数据挖掘的入侵检测系统研究