维吾尔语领域术语抽取研究
摘要 | 第4-6页 |
Abstract | 第6-8页 |
第一章 引言 | 第11-24页 |
1.1 研究背景和意义 | 第11-12页 |
1.2 领域术语相关研究 | 第12-14页 |
1.2.1 领域术语的定义 | 第12页 |
1.2.2 领域术语的特征 | 第12-13页 |
1.2.3 领域术语的特定化和规范化 | 第13-14页 |
1.2.4 领域术语的分类 | 第14页 |
1.3 维吾尔语 | 第14-17页 |
1.3.1 维吾尔语简介 | 第14-15页 |
1.3.2 维吾尔语领域术语的来源 | 第15-17页 |
1.4 领域术语抽取研究 | 第17-22页 |
1.4.1 单词领域术语抽取 | 第17-18页 |
1.4.2 多词领域术语抽取 | 第18-20页 |
1.4.3 维语领域术语抽取存在的问题 | 第20-22页 |
1.5 论文主要工作 | 第22页 |
1.6 论文创新之处 | 第22-23页 |
1.7 论文组织结构 | 第23-24页 |
第二章 维吾尔语单词领域术语抽取 | 第24-43页 |
2.1 维吾尔语单词领域术语的抽取过程 | 第24页 |
2.2 维吾尔语抽取算法的计算指标 | 第24-27页 |
2.2.1 互信息 | 第25-26页 |
2.2.2 TF/IDF 值 | 第26页 |
2.2.3 频率(Frequency) | 第26-27页 |
2.3 熵和条件随机场 | 第27-30页 |
2.3.1 熵 | 第27-28页 |
2.3.2 条件随机场 | 第28-30页 |
2.4 快速扩充原始单词领域术语 | 第30-32页 |
2.5 多词领域术语初探 | 第32-34页 |
2.6 维吾尔语单词领域术语特征模版 | 第34-35页 |
2.7 维吾尔语单词领域术语的语言特征 | 第35-37页 |
2.8 实验和分析 | 第37-41页 |
2.8.1 术语抽取评价指标 | 第37-38页 |
2.8.2 实验语料来源 | 第38-39页 |
2.8.3 语料的规范化处理 | 第39-40页 |
2.8.4 实验和分析 | 第40-41页 |
2.9 本章小结 | 第41-43页 |
第三章 维吾尔语多词领域术语抽取 | 第43-60页 |
3.1 维吾尔语和阿拉伯语的关系 | 第43-44页 |
3.2 维吾尔语多词领域术语抽取 | 第44-46页 |
3.3 多词领域术语抽取算法说明 | 第46-52页 |
3.3.1 语料预处理 | 第46页 |
3.3.2 字符串分割 | 第46-47页 |
3.3.3 互信息和对数似然比率 | 第47-50页 |
3.3.4 相对词频差值计算 | 第50-51页 |
3.3.5 C_value 值计算和术语后处理 | 第51-52页 |
3.4 实验准备和结果分析 | 第52-59页 |
3.4.1 语料获取和标注 | 第52-53页 |
3.4.2 实验总体结果和分析 | 第53-54页 |
3.4.3 改进的互信息实验结果与分析 | 第54页 |
3.4.4 评分函数实验结果与分析 | 第54-55页 |
3.4.5 相对词频差值实验结果与分析 | 第55-56页 |
3.4.6 C_value 的实验结果与分析 | 第56-57页 |
3.4.7 本文算法和其他语种实验算法的比较 | 第57-59页 |
3.5 本章小结 | 第59-60页 |
第四章 总结和展望 | 第60-62页 |
4.1 总结 | 第60页 |
4.2 展望 | 第60-62页 |
参考文献 | 第62-67页 |
致谢 | 第67-68页 |
攻读硕士学位期间发表的论文 | 第68页 |