首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于上下文感知的中文新词识别技术研究

摘要第1-5页
Abstract第5-7页
目录第7-10页
图的目录第10-11页
表的目录第11-12页
1 绪论第12-20页
   ·研究背景及意义第12-15页
     ·研究背景第12-13页
     ·研究意义第13-15页
   ·国内外研究现状第15-16页
   ·论文的主要研究工作和组织结构第16-20页
     ·研究内容第16-17页
     ·技术路线第17-18页
     ·论文组织结构第18-20页
2 理论基础第20-31页
   ·中文分词概述第20-24页
     ·中文分词现状第20-21页
     ·中文分词存在的困难第21-23页
     ·中文分词方法第23-24页
   ·新词定义及其特征第24-27页
     ·新词定义第24-25页
     ·新词产生方式第25-26页
     ·新词特征第26页
     ·新词识别的难题第26-27页
   ·数学基础第27-28页
     ·概率论基础第27-28页
     ·信息论基础第28页
   ·统计语言模型第28-30页
     ·简单的统计模型第29页
     ·基于上下文的统计模型第29页
     ·N阶自适应统计模型第29-30页
   ·本章小结第30-31页
3 语料的处理第31-42页
   ·语料的获取第31-37页
     ·Web语料的特点第31-33页
     ·网络蜘蛛第33-34页
     ·语料库的构建第34-37页
   ·语料中新词的统计特性第37-40页
     ·新词词频特征第37-39页
     ·新词字长特征第39-40页
   ·词库的更新策略第40-41页
   ·本章小结第41-42页
4 基于上下文感知的中文新词识别算法第42-58页
   ·算法的核心思想第42-43页
   ·基于N-gram获取候选词串第43-46页
     ·N-Gram算法第43页
     ·原子切分第43-44页
     ·提取候选词串第44-46页
     ·POS标注第46页
   ·PPM识别第46-57页
     ·PPM算法第46-50页
     ·PPM新词识别过程第50-57页
   ·本章小结第57-58页
5 实验结果与分析第58-63页
   ·实验设计的依据第58页
   ·实验方案第58-60页
   ·性能评价指标第60页
   ·实验结果与分析第60-62页
   ·本章小结第62-63页
6 结论与展望第63-65页
   ·结论第63页
   ·进一步工作第63-65页
参考文献第65-68页
个人简历与硕士学习期间发表论文第68-69页
 个人简历第68页
 硕士学习期间发表论文第68页
 硕士学习期间参与的项目第68-69页
致谢第69-70页

论文共70页,点击 下载论文
上一篇:视觉伺服在棉花裸根苗分离技术中的应用
下一篇:心脏造影图像中血管直径测量技术研究