基于上下文感知的中文新词识别技术研究

摘要	第1-5页
Abstract	第5-7页
目录	第7-10页
图的目录	第10-11页
表的目录	第11-12页
1 绪论	第12-20页
·研究背景及意义	第12-15页
·研究背景	第12-13页
·研究意义	第13-15页
·国内外研究现状	第15-16页
·论文的主要研究工作和组织结构	第16-20页
·研究内容	第16-17页
·技术路线	第17-18页
·论文组织结构	第18-20页
2 理论基础	第20-31页
·中文分词概述	第20-24页
·中文分词现状	第20-21页
·中文分词存在的困难	第21-23页
·中文分词方法	第23-24页
·新词定义及其特征	第24-27页
·新词定义	第24-25页
·新词产生方式	第25-26页
·新词特征	第26页
·新词识别的难题	第26-27页
·数学基础	第27-28页
·概率论基础	第27-28页
·信息论基础	第28页
·统计语言模型	第28-30页
·简单的统计模型	第29页
·基于上下文的统计模型	第29页
·N阶自适应统计模型	第29-30页
·本章小结	第30-31页
3 语料的处理	第31-42页
·语料的获取	第31-37页
·Web语料的特点	第31-33页
·网络蜘蛛	第33-34页
·语料库的构建	第34-37页
·语料中新词的统计特性	第37-40页
·新词词频特征	第37-39页
·新词字长特征	第39-40页
·词库的更新策略	第40-41页
·本章小结	第41-42页
4 基于上下文感知的中文新词识别算法	第42-58页
·算法的核心思想	第42-43页
·基于N-gram获取候选词串	第43-46页
·N-Gram算法	第43页
·原子切分	第43-44页
·提取候选词串	第44-46页
·POS标注	第46页
·PPM识别	第46-57页
·PPM算法	第46-50页
·PPM新词识别过程	第50-57页
·本章小结	第57-58页
5 实验结果与分析	第58-63页
·实验设计的依据	第58页
·实验方案	第58-60页
·性能评价指标	第60页
·实验结果与分析	第60-62页
·本章小结	第62-63页
6 结论与展望	第63-65页
·结论	第63页
·进一步工作	第63-65页
参考文献	第65-68页
个人简历与硕士学习期间发表论文	第68-69页
个人简历	第68页
硕士学习期间发表论文	第68页
硕士学习期间参与的项目	第68-69页
致谢	第69-70页