首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于维基百科的中文命名实体语料库构建研究

中文摘要第4-5页
Abstract第5-6页
第一章 绪论第10-16页
    1.1 课题背景及研究意义第10-11页
    1.2 研究现状与相关工作第11-14页
        1.2.1 命名实体识别概述第11-12页
        1.2.2 维基百科及其应用第12-14页
    1.3 本文研究内容第14-15页
    1.4 论文的组织结构第15-16页
第二章 相关知识介绍第16-27页
    2.1 命名实体识别第16-20页
        2.1.1 命名实体定义第16页
        2.1.2 命名实体识别方法第16-19页
        2.1.3 识别性能评价第19-20页
    2.2 支持向量机第20-23页
        2.2.1 基本原理第20-21页
        2.2.2 SVM特点第21-22页
        2.2.3 SVM工具第22-23页
    2.3 条件随机场第23-27页
        2.3.1 概率无向图模型第23页
        2.3.2 线性条件随机场第23-24页
        2.3.3 条件随机场模型的特点第24页
        2.3.4 基于CRF的命名实体识别第24页
        2.3.5 CRF工具第24-27页
第三章 中文维基百科命名实体分类第27-44页
    3.1 维基百科页面第27-28页
    3.2 维基百科离线包预处理第28-29页
    3.3 命名实体类别体系第29-31页
        3.3.1 命名实体分类体系的设置第29-30页
        3.3.2 维基百科命名实体条目的标注第30-31页
    3.4 基于规则的分类第31-32页
    3.5 基于SVM的分类第32-35页
    3.6 实验结果与分析第35-42页
        3.6.1 实验数据第35-36页
        3.6.2 评估标准第36页
        3.6.3 实验结果第36-42页
        3.6.4 错误分析第42页
    3.7 本章小结第42-44页
第四章 基于维基百科的命名实体语料库构建第44-52页
    4.1 维基百科链接第44-45页
    4.2 构建语料第45-47页
        4.2.1 标注方法第45-46页
        4.2.2 补充标注第46-47页
        4.2.3 选择句子第47页
    4.3 评估语料第47-51页
        4.3.1 语料格式第47-48页
        4.3.2 实验设置第48-49页
        4.3.3 标注质量第49-50页
        4.3.4 封闭测试第50-51页
    4.4 本章小结第51-52页
第五章 维基百科自动标注语料库的应用第52-63页
    5.1 维基百科自动标注语料特点第52-53页
    5.2 维基百科语料和其他语料对比第53-57页
        5.2.1 手工标注语料第53-54页
        5.2.2 语料标注比较第54-55页
        5.2.3 封闭测试对比第55-57页
    5.3 混合测试第57-60页
        5.3.1 混合自动标注语料第57-58页
        5.3.2 混合自动标注语料的正例第58-60页
    5.4 跨领域测试第60-61页
    5.5 本章小结第61-63页
第六章 总结第63-66页
    6.1 工作总结第63-64页
    6.2 工作展望第64-66页
参考文献第66-71页
攻读学位期间公开发表的论文第71页
攻读学位期间申请的软件著作权第71-72页
致谢第72-73页

论文共73页,点击 下载论文
上一篇:面向云存储的属性加密访问控制研究
下一篇:面向微博文本的情绪分析方法研究