现代哈萨克语自动形态分析及语料库建设
摘要 | 第3-5页 |
ABSTRACT | 第5-6页 |
前言 | 第11-19页 |
第一节 研究目的和意义 | 第11-13页 |
一、研究目的 | 第11-12页 |
二、研究意义 | 第12-13页 |
第二节 主要研究方法 | 第13-14页 |
第三节 说明 | 第14-16页 |
一、内容说明 | 第14页 |
二、符号使用说明 | 第14-16页 |
第四节 研究动态 | 第16-19页 |
一、国外研究 | 第16页 |
二、国内研究 | 第16-19页 |
第一章 语料库与自然语言处理 | 第19-23页 |
第一节 语料库语言学 | 第19-21页 |
一、语料库的分类 | 第19-20页 |
二、语料库的实用价值 | 第20-21页 |
第二节 自然语言处理 | 第21-22页 |
第三节 语料库与自然语言处理 | 第22-23页 |
第二章 哈萨克语料库构建方案 | 第23-25页 |
第一节 总目标 | 第23页 |
第二节 实现步骤及任务 | 第23-24页 |
第三节 预期成果 | 第24-25页 |
第三章 基础材料的准备与加工 | 第25-31页 |
第一节 哈萨克语词干表的构建 | 第25-26页 |
第二节 哈萨克语附加成分表的构建 | 第26-27页 |
一、构形词尾表 | 第26页 |
二、构词词缀表 | 第26-27页 |
第三节 语料的选择及初步加工 | 第27-31页 |
一、语料库的规模 | 第27-28页 |
二、语料库的内容 | 第28-29页 |
三、语料的加工 | 第29-31页 |
第四章 哈萨克语自动形态分析 | 第31-36页 |
第一节 自动形态分析的理论依据 | 第31-32页 |
第二节 自动形态分析的必要性 | 第32-33页 |
第三节 哈萨克语形态分析的实现范围 | 第33-36页 |
第五章 哈萨克语自动形态分析系统的建立 | 第36-42页 |
第一节 自动形态分析系统工作流程 | 第36页 |
第二节 哈萨克语自动形态分析步骤 | 第36-39页 |
一、构形词尾切分和词干提取 | 第36-37页 |
二、词干提取和词尾切分总流程 | 第37-39页 |
第三节 人工辅助标注 | 第39页 |
第四节 哈萨克语形态分析系统的实现 | 第39-42页 |
一、形态分析系统主界面 | 第40-41页 |
二、哈萨克语数据库 | 第41-42页 |
第六章 自动形态分析的结果和问题解决 | 第42-55页 |
第一节 自动形态分析结果 | 第42-44页 |
一、实验数据 | 第42页 |
二、实验结果 | 第42-44页 |
第二节 实验中出现的问题 | 第44-46页 |
第三节 自动形态分析中常见问题的解决方案 | 第46-55页 |
一、词形变化的处理 | 第46-47页 |
二、歧义现象的处理 | 第47-52页 |
三、未登录词的处理 | 第52-55页 |
第七章 哈萨克语语料库的应用 | 第55-60页 |
第一节 哈萨克语动词的使动态 | 第55-56页 |
第二节 使动态词尾的缀接情况 | 第56-58页 |
一、使动态词尾t的缀接情况 | 第56页 |
二、使动态词尾DIr | 第56-57页 |
三、使动态词尾GIz | 第57页 |
四、使动态词尾Ir | 第57页 |
五、多种缀接 | 第57-58页 |
第三节 使动态词尾的重叠缀接 | 第58-59页 |
一、重叠缀接两个使动态词尾 | 第58-59页 |
二、重叠缀接三个使动态词尾 | 第59页 |
第四节 使动态词尾构词 | 第59-60页 |
第八章 结论和展望 | 第60-62页 |
第一节 研究成果 | 第60-61页 |
一、构建哈萨克语词法分析系统 | 第60页 |
二、构建20万词哈萨克语web标注语料库 | 第60-61页 |
三、利用语料库对哈萨克语使动态进行定量研究 | 第61页 |
第二节 未来展望 | 第61-62页 |
参考文献 | 第62-65页 |
附录 | 第65-92页 |
附录一 | 第65-80页 |
一、静词 | 第65-72页 |
二、动词 | 第72-80页 |
附录二 哈萨克语形态分析系统使用说明 | 第80-92页 |
一、系统使用说明 | 第80-90页 |
二、系统的维护 | 第90-92页 |
致谢 | 第92-94页 |
攻读学位期间发表的学术论文目录 | 第94页 |