基于统计的开放式汉语自动分词

0．引言	第1-11页
0．1．问题的提出	第7页
0．2．汉语自动分词的发展	第7-8页
0．3．目前存在的问题	第8-9页
0．4．本文主要工作	第9-11页
1．汉语自动分词的基本模型	第11-17页
1．1．分词的形式模型	第11-12页
1．2．分词中歧义问题的描述	第12-13页
1．3．基于规则的分词方法	第13-14页
1．4．基于统计的分词方法	第14-15页
1．5．影响分词系统的几个主要因素	第15-17页
2．语料加工和开放式语料库	第17-25页
2．1．语料库和语料库的建设	第17-18页
2．2．基于语料库的分词方法	第18-20页
2．3．开放语料库	第20-21页
2．4．本文使用的语料加工方法	第21-25页
3．汉语分词的开放学习模型	第25-29页
3．1．可信度修正	第25-26页
3．2．部分三元语法模型	第26-27页
3．3．其它辅助方法	第27-29页
4．监督和非监督相结合的学习过程	第29-33页
4．1．学习的一般过程	第29-30页
4．2．监督学习和非监督学习的结合	第30-32页
4．3．评价的置信区间	第32-33页
5．系统实现	第33-40页
5．1．系统构成	第33-34页
5．2．切分算法	第34-36页
5．3．知识库的构造	第36-37页
5．4．人机交互	第37-40页
6．实验结果分析	第40-43页
6．1．开放分词的评价标准	第40页
6．2．模型参数确定	第40-41页
6．2．1．开放学习模型参数的确定	第40-41页
6．2．2．句子可信度和切分正确率的关系验证	第41页
6．3．测试结果分析	第41-43页
7．结束语	第43-45页
7．1．结论	第43-44页
7．2．展望	第44-45页
致谢	第45-46页
参考文献	第46-47页