大中华区词对齐自动抽取研究

摘要	第3-5页
ABSTRACT	第5-6页
1 引言	第9-20页
1.1 研究背景及意义	第9-10页
1.1.1 研究背景	第9-10页
1.1.2 研究意义	第10页
1.2 国内外研究现状	第10-18页
1.2.1 大中华区语言差异研究现状	第11-13页
1.2.2 词对齐研究现状	第13-18页
1.3 文献述评	第18-19页
1.4 论文组织结构	第19-20页
2 大中华区词对齐语料库的构建	第20-26页
2.1 词对齐语料库的建立	第20-22页
2.1.1 语料收集框架	第20-22页
2.1.2 语料存储格式	第22页
2.2 语料标注	第22-25页
2.2.1 标注工具	第23-24页
2.2.2 标注规范	第24-25页
2.2.3 标注一致性	第25页
2.3 本章总结	第25-26页
3 基于WORD2VEC的词对齐自动抽取方法	第26-39页
3.1 相关研究	第26-29页
3.1.1 词向量	第26页
3.1.2 神经网络语言模型	第26-27页
3.1.3 word2vec模型	第27-29页
3.2 两阶段词对齐自动抽取方法	第29-31页
3.2.1 词对齐算法阶段 1	第29-30页
3.2.2 词对齐算法阶段 2	第30-31页
3.3 实验设置	第31-38页
3.3.1 实验结果与分析	第32-36页
3.3.2 大中华区三元组识别性能	第36-38页
3.4 本章总结	第38-39页
4 基于映射规则的词对齐自动抽取方法	第39-47页
4.1 相关研究	第39页
4.2 基于映射规则的词对齐自动抽取方法	第39-42页
4.2.1 映射规则的词对齐算法	第40页
4.2.2 映射规则后处理	第40-42页
4.3 实验设计及结果	第42-46页
4.3.1 实验设置	第42页
4.3.2 实验结果	第42-46页
4.4 本章总结	第46-47页
5 总结与展望	第47-49页
5.1 全文总结	第47-48页
5.2 未来工作	第48-49页
参考文献	第49-54页
致谢	第54-55页
在读期间公开发表论文（著）及科研情况	第55页