首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

音译外国人名自动识别的研究

摘要第4-5页
Abstract第5页
1 绪论第8-13页
    1.1 汉语自动分词第8-10页
        1.1.1 最大匹配法第8-9页
        1.1.2 逐词遍历匹配法第9页
        1.1.3 最大概率法分词第9-10页
        1.1.4 最佳匹配法第10页
    1.2 汉语自动分词的难点第10页
    1.3 音译外国人名自动识别研究现状第10-11页
    1.4 音译外国人名识别的意义和目前的问题第11-12页
    1.5 本论文的工作第12-13页
2 专有名词自动识别模型第13-25页
    2.1 支持向量机第13-15页
        2.1.1 SVM的原理第13-14页
        2.1.2 SVM分类器的构造第14-15页
    2.2 隐马尔科夫模型(HMM)第15-18页
        2.2.1 隐马尔科夫模型原理第15-16页
        2.2.2 HMM应用与音译外国人名识别第16-17页
        2.2.3 HMM的局限性第17-18页
    2.3 最大熵模型ME第18-20页
        2.3.1 最大熵模型的基本理论第18页
        2.3.2 最大熵基本原理第18-20页
    2.4 条件随机场模型CRFs第20-25页
        2.4.1 CRF的无向图结构及其势函数表示第21-22页
        2.4.2 CRFs的最大似然估计第22-25页
3 基于统计的音译名识别模型第25-38页
    3.1 外国人名的使用规律第25-27页
        3.1.1 外国人名用字特点第25页
        3.1.2 名字用字分类第25-26页
        3.1.3 外国人名结构特点第26页
        3.1.4 音译外国人名识别中的上下文特征第26-27页
        3.1.5 外国人名识别的其他特点第27页
    3.2 音译外国人名识别的方法第27-33页
        3.2.1 潜在人名识别第27-28页
        3.2.2 潜在人名频度和可信度第28-30页
        3.2.3 潜在人名过滤第30-31页
        3.2.4 潜在姓名链建立第31-33页
        3.2.5 含潜在人名的分词第33页
        3.2.6 召回被过滤掉的潜在名字第33页
    3.3 模型建立与分析第33-38页
        3.3.1 主要数据结构第34-35页
        3.3.2 算法描述第35-38页
4 实验及结果分析第38-44页
    4.1 实验数据说明第38页
    4.2 评价方法及实验结果第38-39页
    4.3 错误类型及原因分析第39-42页
        4.3.1 音译外国人名识别的结果分析第39页
        4.3.2 识别姓名时发生的错误分类及原因分析第39-41页
        4.3.3 影响统计模型是否有效的因素第41页
        4.3.4 关于统计模型的优点与缺点第41-42页
    4.4 本文的主要改进第42-44页
        4.4.1 含符号“·”或“-”的音译名处理第42-43页
        4.4.2 动态词典第43-44页
5 结论与展望第44-47页
    5.1 结论第44-46页
    5.2 展望第46-47页
参考文献第47-50页
攻读硕士学位期间发表学术论文情况第50-51页
致谢第51-53页

论文共53页,点击 下载论文
上一篇:城轨车辆中央控制单元设计
下一篇:基于MapReduce的海量数据K-means聚类算法研究