首页--语言、文字论文--汉语论文--古代汉语论文

古汉语编年体的人名实体识别与词性标注

中文摘要第7-8页
Abstract第8-9页
第一章 绪论第10-17页
    1.1 现代汉语信息处理的研究介绍及现状概述第12-14页
        1.1.1 汉语分词第12页
        1.1.2 名词实体识别第12-13页
        1.1.3 姓名歧义区分第13页
        1.1.4 汉语语法分析第13页
        1.1.5 词语语境推测第13-14页
    1.2 研究古汉语信息处理的目的第14-16页
        1.2.1 古汉语信息处理研究缺乏第14页
        1.2.2 古汉语研究对现代汉语语法解析的启发第14页
        1.2.3 古汉语信息提取研究对其他学科的意义第14-16页
    1.3 论文内容和组织结构第16-17页
第二章 基于CRF模型的词性标注在古汉语语言处理中的应用第17-34页
    2.1 选择编年体作为研究语料第17-19页
    2.2 跳过分词进行词性标注第19-20页
    2.3 常用的序列标记算法第20-23页
        2.3.1 常见的序列模型比较第20-21页
        2.3.2 条件随机场模型中的特征第21-22页
        2.3.3 使用的算法框架以及三种图模型第22-23页
    2.4 实验分析与结果第23-33页
        2.4.1 数据集的制作第23-24页
        2.4.2 评估标准第24-25页
        2.4.3 专有名词识别实验结果与分析第25-26页
        2.4.4 人名识别实验结果与分析第26页
        2.4.5 词性标注实验结果与分析第26-31页
        2.4.6 CRF模型自动标注词性的机器识别错误分析第31-33页
    2.5 小结第33-34页
第三章 基于规则的编年体史料姓名实体抽取第34-43页
    3.1 使用规则识别编年体中的人名第34-36页
        3.1.1 古汉语不能套用现代汉语的规则第34页
        3.1.2 编年体中人名周边的规则第34-36页
    3.2 实验材料、规则列表以及算法实现第36-39页
    3.3 实验结果与分析第39-42页
        3.3.1 人名识别的精确率、召回率与F1值第39-40页
        3.3.2 方法不足之处第40-42页
    3.4 小结第42-43页
第四章 总结与展望第43-46页
    4.1 论文的主要成果第43-44页
    4.2 实验分析中存在的问题第44-45页
    4.3 展望第45-46页
参考文献第46-48页
致谢第48-49页

论文共49页,点击 下载论文
上一篇:大麻素受体激动剂WIN55212-2对大鼠视网膜神经节细胞外向钾电流的调控及其机制
下一篇:腹膜透析患者心理问题影响因素调査及综合心理干预效果研究