首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中英文混合分词方法及应用研究

摘要第1-5页
Abstract第5-9页
1 引言第9-12页
   ·研究背景及意义第9-10页
     ·研究背景第9-10页
     ·研究意义第10页
   ·研究现状第10-11页
   ·论文的组织第11-12页
2 分词算法综述第12-17页
   ·中文自动分词基本算法第12-14页
     ·基于字符串匹配算法第12-13页
     ·基于统计的方法第13页
     ·基于理解的方法第13-14页
   ·歧义处理第14-15页
     ·歧义定义第14页
     ·探测歧义第14页
     ·消歧算法第14-15页
   ·未登录词识别第15-16页
     ·未登录词识别的方法第15页
     ·未登录词识别的现状第15-16页
   ·中文分词评价第16-17页
3 中英文混合分词评价体系第17-19页
   ·中英文混合使用现象原因第17页
   ·中英文混合特点第17-18页
     ·由引进英文而产生的歧义第17页
     ·网络语言的大量使用第17页
     ·由领域性产生的歧义第17页
     ·缺失字母问题第17-18页
   ·中英文混合分词评价体系第18-19页
     ·增加词语纠错能力评价第18页
     ·未登录词标准发生变化第18-19页
4 中英文混合分词的算法实现第19-40页
   ·常用的分词词典第19-23页
     ·整词二分的分词词典机制第19-21页
     ·TRIE 索引树的分词词典机制第21-22页
     ·逐字二分的分词词典机制第22-23页
   ·三种分词词典机制的实验结果第23-24页
   ·本文采用的词典机制第24-26页
     ·改进的词典机制第25-26页
   ·词典的实现第26-30页
     ·词典的构成第26页
     ·词典定义第26-27页
     ·加载基本词典第27-29页
     ·加载停用词典和姓氏词典第29-30页
   ·中英文混合分词算法第30-35页
     ·初切分算法第30-31页
     ·分词过程第31-35页
   ·歧义处理第35-38页
     ·中英文混合歧义形式第35页
     ·歧义探测第35-36页
     ·改进的消歧算法第36-37页
     ·与消歧效果第37-38页
   ·系统功能实现第38-40页
5 中英文混合分词在中国风能信息中心的应用第40-44页
   ·系统介绍第40页
   ·分词、文本自动分类的实现第40-44页
     ·技术类别第40-41页
     ·文本自动归档第41-44页
6 总结第44-46页
   ·论文总结第44页
   ·有待继续完善的工作第44-46页
参考文献第46-49页
在读期间发表的学术论文第49-50页
作者简介第50-51页
致谢第51页

论文共51页,点击 下载论文
上一篇:领域知识的理解与应答方法的研究
下一篇:落叶松林分生长枝条躲让效应计算机模拟研究