摘要 | 第1-4页 |
Abstract | 第4-5页 |
目录 | 第5-7页 |
1 绪论 | 第7-16页 |
·基本概念及研究背景 | 第7-10页 |
·术语的定义、特点和分类 | 第7-9页 |
·术语学 | 第9-10页 |
·术语自动抽取的意义 | 第10-11页 |
·术语抽取的发展现状 | 第11-13页 |
·利用信息检索中的自动索引技术进行术语抽取 | 第11页 |
·基于语言学知识的术语自动抽取 | 第11-12页 |
·基于统计的术语自动抽取 | 第12-13页 |
·研究内容及目标 | 第13-14页 |
·论文安排 | 第14-16页 |
2 双语术语抽取相关技术 | 第16-30页 |
·双语术语抽取定义及主要工作 | 第16-17页 |
·单语术语抽取 | 第17-22页 |
·基于词典的术语抽取方法 | 第17-18页 |
·基于规则的术语抽取方法 | 第18-20页 |
·机器学习和统计的术语抽取方法 | 第20-21页 |
·综合的术语抽取方法 | 第21-22页 |
·词对齐 | 第22-23页 |
·基于信源信道模型的词对齐方法 | 第23-26页 |
·隐马尔可夫模型(Hidden Markov Model) | 第23-25页 |
·IBM的Model 1 | 第25页 |
·IBM的Model 2 | 第25页 |
·IBM的Model 3 | 第25-26页 |
·IBM的Model 4和 Model 5 | 第26页 |
·基于相似度函数的词对齐方法 | 第26-27页 |
·常用的相似度函数 | 第27-29页 |
·互信息 | 第27页 |
·x~2测试 | 第27-28页 |
·Log-likelihood比率 | 第28-29页 |
·小结 | 第29-30页 |
3 基于相似度函数方法下的对齐词典的生成 | 第30-39页 |
·词典生成 | 第30-37页 |
·整体流程 | 第30-31页 |
·语料预处理 | 第31-32页 |
·编码 | 第32-33页 |
·生成共现矩阵 | 第33-34页 |
·生成对齐词典 | 第34-37页 |
·几种改进的对齐方法尝试 | 第37页 |
·n元结合法 | 第37页 |
·迭代对齐 | 第37页 |
·词串对齐方法 | 第37-38页 |
·基于平行语料的双语多词术语抽取方法概述 | 第38页 |
·小结 | 第38-39页 |
4 基于EM算法的共现矩阵优化方法 | 第39-45页 |
·EM算法的基本思想 | 第39页 |
·算法描述 | 第39-41页 |
·算法在优化共现矩阵中的应用 | 第41-44页 |
·问题描述 | 第41-42页 |
·算法应用 | 第42-44页 |
·本章小结 | 第44-45页 |
5 实验 | 第45-56页 |
·系统结构 | 第45-46页 |
·系统框架 | 第45-46页 |
·模块说明 | 第46页 |
·实验条件 | 第46-47页 |
·实验设计 | 第47-48页 |
·系统开销实验设计 | 第47页 |
·术语对抽取实验设计 | 第47-48页 |
·实验结果及数据分析 | 第48-56页 |
·性能指标 | 第48-49页 |
·实验结果与分析 | 第49-56页 |
6 总结与展望 | 第56-57页 |
·总结 | 第56页 |
·展望 | 第56-57页 |
致谢 | 第57-58页 |
参考文献 | 第58-62页 |