首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于语料库的哈萨克文统计研究

摘要第1-3页
Abstract第3-4页
目录第4-6页
第一章 引言第6-11页
   ·课题来源第6页
   ·研究背景第6-7页
   ·研究意义和对象第7-8页
   ·研究现状第8-10页
   ·本文工作安排第10-11页
第二章 哈萨克语统计前相关概念和方法第11-19页
   ·哈萨克文特点第11页
   ·哈萨克文字母和文字编码第11-12页
     ·哈萨克文字母第11页
     ·哈萨克文字编码第11-12页
   ·幂律的分布研究第12-13页
   ·哈萨克语领域领域通用度的相关概念和方法第13-15页
     ·词频统计术语第13页
     ·语言中词语的稳态,和词语的动态第13-14页
     ·哈萨克语词汇统计所采用的基本方式与方法第14-15页
     ·哈萨克文词语领域通用度统计总体任务步骤第15页
   ·哈萨克语词组抽取的相关概念和方法第15-17页
     ·基于规则的方法第15页
     ·正向最大匹配算法第15-16页
     ·逆向最大匹配算法第16页
     ·双向匹配法第16页
     ·基于统计的方法第16页
     ·N元语法模型称为N-1阶马尔可夫模型第16-17页
   ·哈萨克语词频统计的总体模块图第17-19页
第三章 哈萨克语字母、词频率统计研究第19-30页
   ·zipf定律第19-20页
   ·zipf的省力原则第20-21页
     ·省力原则提出背景第20-21页
     ·"省力原则"的含义第21页
   ·"省力原则"的论证第21-22页
   ·语言领域中"省力原则"与"经济原则"关系第22页
   ·哈萨克语词频与幕律的关系第22-24页
   ·实验与结果分析第24-28页
     ·实验语料的准备第24页
     ·哈萨克词语开头字母统计结果第24-25页
     ·哈萨克语所有字母统计结果第25页
     ·哈萨克语的长度统计及分析第25-27页
     ·不同长度哈萨克语的词频统计结果第27-28页
   ·开发工具与系统界面第28-29页
     ·哈萨克语打头字母的界面第28-29页
     ·哈萨克语字母统计结果图第29页
     ·哈萨克语词,长度,次数,频率统计界面第29页
   ·本章小结第29-30页
第四章 哈萨克语词汇领域通用度的研究与实现第30-40页
   ·关于高频词第30-31页
   ·语领域通用度的几个基本概念第31页
   ·哈萨克领域通用度计算方法第31-34页
     ·传哈萨克语领域通用度的计算方法第31-32页
     ·领域通用度计算方法的弊端第32-33页
     ·改进后的哈语词语领域通用度计算方法第33-34页
   ·哈萨克语词汇领域通用度的计算流程及步骤第34-37页
     ·哈萨克语词汇领域通用度计算流程第34-35页
     ·哈萨克语词汇领域通用度计算步骤第35-37页
   ·哈萨克语领域通用度结果与分析第37-38页
     ·实验语料的准备和性能评测指标第37页
     ·实验结果分析第37-38页
   ·开发环境与界面第38-39页
   ·本章小结第39-40页
第五章 哈萨克词组的识别研究与实现第40-48页
   ·哈萨克语基本词汇的特点第40页
   ·哈萨克语词组的种类第40-41页
   ·N-Gram在哈萨克语词组识别中的应用第41-42页
   ·哈萨克语词组概率统计模型第42-43页
   ·基于最大词典匹配的方法统计哈萨克语词第43-44页
     ·哈萨克语词组的词典建立如下第44页
   ·哈萨克语词组词典匹配算法的基本过程第44-45页
   ·哈萨克语词组数据统计分析第45-47页
     ·哈语实验语料的准备和性能评测指标第45-46页
     ·最大匹配和N-Gram统计哈萨克语词组界面第46-47页
   ·本章小结第47-48页
第六章 结论与展望第48-50页
   ·本文工作总结第48-49页
   ·今后的工作第49-50页
参考文献第50-52页
攻读硕士学位期间参加的项目第52-53页
攻读硕士学位期间发表的论文第53-54页
致谢第54-55页

论文共55页,点击 下载论文
上一篇:基于服务的公众出行系统研究
下一篇:基于N-gram模型的哈萨克语实体名识别方法研究