首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于统计的开放式汉语自动分词

0. 引言第1-11页
 0.1. 问题的提出第7页
 0.2. 汉语自动分词的发展第7-8页
 0.3. 目前存在的问题第8-9页
 0.4. 本文主要工作第9-11页
1. 汉语自动分词的基本模型第11-17页
 1.1. 分词的形式模型第11-12页
 1.2. 分词中歧义问题的描述第12-13页
 1.3. 基于规则的分词方法第13-14页
 1.4. 基于统计的分词方法第14-15页
 1.5. 影响分词系统的几个主要因素第15-17页
2. 语料加工和开放式语料库第17-25页
 2.1. 语料库和语料库的建设第17-18页
 2.2. 基于语料库的分词方法第18-20页
 2.3. 开放语料库第20-21页
 2.4. 本文使用的语料加工方法第21-25页
3. 汉语分词的开放学习模型第25-29页
 3.1. 可信度修正第25-26页
 3.2. 部分三元语法模型第26-27页
 3.3. 其它辅助方法第27-29页
4. 监督和非监督相结合的学习过程第29-33页
 4.1. 学习的一般过程第29-30页
 4.2. 监督学习和非监督学习的结合第30-32页
 4.3. 评价的置信区间第32-33页
5. 系统实现第33-40页
 5.1. 系统构成第33-34页
 5.2. 切分算法第34-36页
 5.3. 知识库的构造第36-37页
 5.4. 人机交互第37-40页
6. 实验结果分析第40-43页
 6.1. 开放分词的评价标准第40页
 6.2. 模型参数确定第40-41页
  6.2.1. 开放学习模型参数的确定第40-41页
  6.2.2. 句子可信度和切分正确率的关系验证第41页
 6.3. 测试结果分析第41-43页
7. 结束语第43-45页
 7.1. 结论第43-44页
 7.2. 展望第44-45页
致谢第45-46页
参考文献第46-47页

论文共47页,点击 下载论文
上一篇:DSP处理器系统结构研究
下一篇:三维重建中插值建模及其可视化的研究