首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于归纳学习法的日语假名和汉语实体对自动获取方法

致谢第5-6页
摘要第6-7页
ABSTRACT第7页
1. 绪论第10-16页
    1.1. 研究背景及意义第10-11页
    1.2. 研究发展及现状第11-14页
    1.3. 论文的主要内容第14页
    1.4. 论文的组织结构第14-16页
2. 理论与技术基础第16-28页
    2.1. 命名实体识别第16-18页
    2.2. 命名实体翻译等价对的获取第18-21页
    2.3. 统计机器翻译第21-24页
    2.4. 归纳学习法第24-25页
    2.5. 日语假名第25-27页
    2.6. 罗马字第27-28页
3. 日语假名和汉语实体对的自动获取第28-44页
    3.1. 从单语语料库中抽取命名实体第29-36页
        3.1.1 最大熵模型第30-31页
        3.1.2 条件随机场模型第31-33页
        3.1.3 汉语命名实体抽取第33-34页
        3.1.4 日语命名实体抽取第34-36页
    3.2. 假名命名实体的标注方法第36-37页
    3.3. 实例筛选第37-40页
        3.3.1 频数统计第38-39页
        3.3.2 编辑距离第39页
        3.3.3 余弦距离第39-40页
    3.4. 归纳学习第40-42页
    3.5. 规则校正第42-43页
    3.6. 实体中汉字的处理第43页
    3.7. 假名实体对的获取第43-44页
4. 实验及分析第44-50页
    4.1. 基线系统第44-45页
    4.2. 实验设置第45-46页
        4.2.1 实验语料第45页
        4.2.2 实验工具第45页
        4.2.3 参数设定第45页
        4.2.4 评价方法第45-46页
    4.3. 实验结果第46-50页
5. 结论第50-51页
参考文献第51-54页
附录A第54-56页
作者简历及攻读硕士学位期间取得的研究成果第56-58页
学位论文数据集第58页

论文共58页,点击 下载论文
上一篇:套筒石灰窑换热器管束堵塞后快速检修技术研究
下一篇:相似多目标在LED芯片识别中的研究