未登录中文领域术语识别研究--以系统生物学领域为例
| 内容摘要 | 第6-7页 |
| ABSTRACT | 第7-8页 |
| 目录 | 第9-10页 |
| 图表目录 | 第10-12页 |
| 1 绪论 | 第12-17页 |
| 1.1 研究背景 | 第12-14页 |
| 1.2 本文研究 | 第14-17页 |
| 2 研究现状分析 | 第17-25页 |
| 2.1 基于规则的方法 | 第17-18页 |
| 2.2 基于统计的方法 | 第18-23页 |
| 2.3 统计和规则结合的方法 | 第23-25页 |
| 3 建立语料库 | 第25-29页 |
| 3.1 语料来源 | 第25页 |
| 3.2 语料库的构建 | 第25-28页 |
| 3.3 术语特性分析 | 第28-29页 |
| 4 术语识别系统框架 | 第29-37页 |
| 4.1 总体框架 | 第29-30页 |
| 4.2 模型选择 | 第30-31页 |
| 4.3 候选特征 | 第31-33页 |
| 4.4 特征模板 | 第33-34页 |
| 4.5 标注集 | 第34-35页 |
| 4.6 系统评价指标 | 第35-37页 |
| 5 术语识别模型研究 | 第37-51页 |
| 5.1 模型构建思路及实验步骤 | 第37页 |
| 5.2 建立试验模型 | 第37-47页 |
| 5.3 模型评价 | 第47页 |
| 5.4 规则处理 | 第47-49页 |
| 5.5 模型对未登录低频术语的识别效果 | 第49页 |
| 5.6 与相关研究比较 | 第49-51页 |
| 6 总结与展望 | 第51-52页 |
| 参考文献 | 第52-55页 |
| 附录 系统核心功能代码 | 第55-66页 |
| 后记 | 第66页 |