基于归纳学习法的日语假名和汉语实体对自动获取方法

致谢	第5-6页
摘要	第6-7页
ABSTRACT	第7页
1. 绪论	第10-16页
1.1. 研究背景及意义	第10-11页
1.2. 研究发展及现状	第11-14页
1.3. 论文的主要内容	第14页
1.4. 论文的组织结构	第14-16页
2. 理论与技术基础	第16-28页
2.1. 命名实体识别	第16-18页
2.2. 命名实体翻译等价对的获取	第18-21页
2.3. 统计机器翻译	第21-24页
2.4. 归纳学习法	第24-25页
2.5. 日语假名	第25-27页
2.6. 罗马字	第27-28页
3. 日语假名和汉语实体对的自动获取	第28-44页
3.1. 从单语语料库中抽取命名实体	第29-36页
3.1.1 最大熵模型	第30-31页
3.1.2 条件随机场模型	第31-33页
3.1.3 汉语命名实体抽取	第33-34页
3.1.4 日语命名实体抽取	第34-36页
3.2. 假名命名实体的标注方法	第36-37页
3.3. 实例筛选	第37-40页
3.3.1 频数统计	第38-39页
3.3.2 编辑距离	第39页
3.3.3 余弦距离	第39-40页
3.4. 归纳学习	第40-42页
3.5. 规则校正	第42-43页
3.6. 实体中汉字的处理	第43页
3.7. 假名实体对的获取	第43-44页
4. 实验及分析	第44-50页
4.1. 基线系统	第44-45页
4.2. 实验设置	第45-46页
4.2.1 实验语料	第45页
4.2.2 实验工具	第45页
4.2.3 参数设定	第45页
4.2.4 评价方法	第45-46页
4.3. 实验结果	第46-50页
5. 结论	第50-51页
参考文献	第51-54页
附录A	第54-56页
作者简历及攻读硕士学位期间取得的研究成果	第56-58页
学位论文数据集	第58页