首页--文化、科学、教育、体育论文--科学、科学研究论文--科学研究理论论文--专利研究论文

基于字角色标注的中文专利术语识别研究

摘要第5-7页
Abstract第7-8页
1 绪论第11-16页
    1.1 研究背景及意义第11-12页
    1.2 专利术语的特点及其识别难点第12-13页
        1.2.1 专利术语的特点第12-13页
        1.2.2 专利术语自动识别的难点第13页
    1.3 专利术语自动识别的研究现状第13-15页
    1.4 本文研究工作概述第15-16页
2 相关统计模型介绍第16-20页
    2.1 有向图模型与无向图模型第16-17页
        2.1.1 有向图模型第16-17页
        2.1.2 无向图模型第17页
    2.2 条件随机场模型第17-20页
        2.2.1 条件随机场模型的定义第17页
        2.2.2 条件随机场模型的参数化形式第17-18页
        2.2.3 条件随机场模型的简化形式第18-19页
        2.2.4 条件随机场模型的优势第19-20页
3 基于字角色标注的专利术语识别第20-37页
    3.1 基于字角色标注的专利术语自动识别过程——技术路线第20-22页
    3.2 来源语料的预处理第22-23页
    3.3 字角色标注序列的构建第23-25页
        3.3.1 字角色的定义第23-24页
        3.3.2 字角色的标注第24-25页
    3.4 特征项及特征模板的构建第25-29页
        3.4.1 特征项的定义第25-27页
        3.4.2 特征模板的构建第27-29页
    3.5 特征观察序列的构建第29-34页
        3.5.1 字特征的标注(序列Z)第30页
        3.5.2 音译字特征的标注(序列Y)第30-31页
        3.5.3 姓氏特征的标注(序列X)第31页
        3.5.4 词位特征的标注(序列W)第31-32页
        3.5.5 化工元素特征的标注(序列H)第32-33页
        3.5.6 字频特征的标注(序列P)第33-34页
    3.6 基于条件随机场模型的机器学习第34-35页
    3.7 术语的自动识别第35-37页
4 实验结果与分析第37-42页
    4.1 测评指标定义第37页
    4.2 实验结果统计第37-40页
    4.3 实验结果分析第40-42页
5 结语第42-45页
参考文献第45-47页
附录A 中文常见姓氏集合第47-48页
附录B 汉字化工元素集合第48-49页
致谢第49-50页

论文共50页,点击 下载论文
上一篇:主题式教学模式在培养汉语口语成段表达能力中的作用--以CIB和CET项目中级汉语水平的美国留学生为例
下一篇:中韩孪生词难度对比分析及教学策略