基于统计的双语术语自动抽取

摘要	第1-4页
Abstract	第4-5页
目录	第5-7页
1 绪论	第7-16页
·基本概念及研究背景	第7-10页
·术语的定义、特点和分类	第7-9页
·术语学	第9-10页
·术语自动抽取的意义	第10-11页
·术语抽取的发展现状	第11-13页
·利用信息检索中的自动索引技术进行术语抽取	第11页
·基于语言学知识的术语自动抽取	第11-12页
·基于统计的术语自动抽取	第12-13页
·研究内容及目标	第13-14页
·论文安排	第14-16页
2 双语术语抽取相关技术	第16-30页
·双语术语抽取定义及主要工作	第16-17页
·单语术语抽取	第17-22页
·基于词典的术语抽取方法	第17-18页
·基于规则的术语抽取方法	第18-20页
·机器学习和统计的术语抽取方法	第20-21页
·综合的术语抽取方法	第21-22页
·词对齐	第22-23页
·基于信源信道模型的词对齐方法	第23-26页
·隐马尔可夫模型(Hidden Markov Model)	第23-25页
·IBM的Model 1	第25页
·IBM的Model 2	第25页
·IBM的Model 3	第25-26页
·IBM的Model 4和 Model 5	第26页
·基于相似度函数的词对齐方法	第26-27页
·常用的相似度函数	第27-29页
·互信息	第27页
·x~2测试	第27-28页
·Log-likelihood比率	第28-29页
·小结	第29-30页
3 基于相似度函数方法下的对齐词典的生成	第30-39页
·词典生成	第30-37页
·整体流程	第30-31页
·语料预处理	第31-32页
·编码	第32-33页
·生成共现矩阵	第33-34页
·生成对齐词典	第34-37页
·几种改进的对齐方法尝试	第37页
·n元结合法	第37页
·迭代对齐	第37页
·词串对齐方法	第37-38页
·基于平行语料的双语多词术语抽取方法概述	第38页
·小结	第38-39页
4 基于EM算法的共现矩阵优化方法	第39-45页
·EM算法的基本思想	第39页
·算法描述	第39-41页
·算法在优化共现矩阵中的应用	第41-44页
·问题描述	第41-42页
·算法应用	第42-44页
·本章小结	第44-45页
5 实验	第45-56页
·系统结构	第45-46页
·系统框架	第45-46页
·模块说明	第46页
·实验条件	第46-47页
·实验设计	第47-48页
·系统开销实验设计	第47页
·术语对抽取实验设计	第47-48页
·实验结果及数据分析	第48-56页
·性能指标	第48-49页
·实验结果与分析	第49-56页
6 总结与展望	第56-57页
·总结	第56页
·展望	第56-57页
致谢	第57-58页
参考文献	第58-62页