基于有效子串的最大熵中文分词方法

内容摘要	第5-6页
Abstract	第6-7页
第1章绪论	第10-15页
1.1 中文分词方法研究的背景及意义	第10-12页
1.2 中文分词的发展现状	第12页
1.3 研究内容及章节结构	第12-13页
1.4 可能创新之处和不足	第13-15页
第2章中文分词方法的研究	第15-24页
2.1 中文分词的难点	第15-17页
2.2 中文分词的方法	第17-23页
2.3 小结	第23-24页
第3章最大熵模型	第24-39页
3.1 最大熵模型基础	第24-29页
3.1.1 最大熵模型	第24-27页
3.1.2 极大似然方法	第27-29页
3.2 最大熵模型的参数估计算法	第29-34页
3.2.1 通用迭代算法	第29-30页
3.2.2 改进的迭代尺度法	第30-33页
3.2.3 拟牛顿法	第33-34页
3.3 特征选择	第34-38页
3.3.1 基于频数阈值的特征选择	第35页
3.3.2 增量式特征选择	第35-38页
3.4 小结	第38-39页
第4章基于有效子串的最大熵中文分词方法	第39-52页
4.1 基于有效的子串的最大熵中文分词方法的框架	第39-43页
4.1.1 提取有效子串的方法	第41页
4.1.2 字标注集	第41-42页
4.1.3 特征的选取	第42-43页
4.2 基于有效子串的最大熵中文分词方法评价	第43-51页
4.2.1 分词训练阶段	第44-45页
4.2.2 分词测试阶段	第45-48页
4.2.3 实验结果及分析	第48-51页
4.3 小结	第51-52页
第5章结束语	第52-53页
参考文献	第53-55页
后记	第55页