| 摘要 | 第1-4页 |
| Abstract | 第4-5页 |
| 目录 | 第5-7页 |
| 1 绪论 | 第7-16页 |
| ·基本概念及研究背景 | 第7-10页 |
| ·术语的定义、特点和分类 | 第7-9页 |
| ·术语学 | 第9-10页 |
| ·术语自动抽取的意义 | 第10-11页 |
| ·术语抽取的发展现状 | 第11-13页 |
| ·利用信息检索中的自动索引技术进行术语抽取 | 第11页 |
| ·基于语言学知识的术语自动抽取 | 第11-12页 |
| ·基于统计的术语自动抽取 | 第12-13页 |
| ·研究内容及目标 | 第13-14页 |
| ·论文安排 | 第14-16页 |
| 2 双语术语抽取相关技术 | 第16-30页 |
| ·双语术语抽取定义及主要工作 | 第16-17页 |
| ·单语术语抽取 | 第17-22页 |
| ·基于词典的术语抽取方法 | 第17-18页 |
| ·基于规则的术语抽取方法 | 第18-20页 |
| ·机器学习和统计的术语抽取方法 | 第20-21页 |
| ·综合的术语抽取方法 | 第21-22页 |
| ·词对齐 | 第22-23页 |
| ·基于信源信道模型的词对齐方法 | 第23-26页 |
| ·隐马尔可夫模型(Hidden Markov Model) | 第23-25页 |
| ·IBM的Model 1 | 第25页 |
| ·IBM的Model 2 | 第25页 |
| ·IBM的Model 3 | 第25-26页 |
| ·IBM的Model 4和 Model 5 | 第26页 |
| ·基于相似度函数的词对齐方法 | 第26-27页 |
| ·常用的相似度函数 | 第27-29页 |
| ·互信息 | 第27页 |
| ·x~2测试 | 第27-28页 |
| ·Log-likelihood比率 | 第28-29页 |
| ·小结 | 第29-30页 |
| 3 基于相似度函数方法下的对齐词典的生成 | 第30-39页 |
| ·词典生成 | 第30-37页 |
| ·整体流程 | 第30-31页 |
| ·语料预处理 | 第31-32页 |
| ·编码 | 第32-33页 |
| ·生成共现矩阵 | 第33-34页 |
| ·生成对齐词典 | 第34-37页 |
| ·几种改进的对齐方法尝试 | 第37页 |
| ·n元结合法 | 第37页 |
| ·迭代对齐 | 第37页 |
| ·词串对齐方法 | 第37-38页 |
| ·基于平行语料的双语多词术语抽取方法概述 | 第38页 |
| ·小结 | 第38-39页 |
| 4 基于EM算法的共现矩阵优化方法 | 第39-45页 |
| ·EM算法的基本思想 | 第39页 |
| ·算法描述 | 第39-41页 |
| ·算法在优化共现矩阵中的应用 | 第41-44页 |
| ·问题描述 | 第41-42页 |
| ·算法应用 | 第42-44页 |
| ·本章小结 | 第44-45页 |
| 5 实验 | 第45-56页 |
| ·系统结构 | 第45-46页 |
| ·系统框架 | 第45-46页 |
| ·模块说明 | 第46页 |
| ·实验条件 | 第46-47页 |
| ·实验设计 | 第47-48页 |
| ·系统开销实验设计 | 第47页 |
| ·术语对抽取实验设计 | 第47-48页 |
| ·实验结果及数据分析 | 第48-56页 |
| ·性能指标 | 第48-49页 |
| ·实验结果与分析 | 第49-56页 |
| 6 总结与展望 | 第56-57页 |
| ·总结 | 第56页 |
| ·展望 | 第56-57页 |
| 致谢 | 第57-58页 |
| 参考文献 | 第58-62页 |