首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Helmholtz原理的中文新词识别

摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-13页
   ·研究背景及意义第9页
   ·新词的定义及特点第9-11页
     ·新词的定义第9-10页
     ·新词的特点第10-11页
   ·新词识别的难点第11页
   ·本文的研究内容与结构安排第11-13页
第二章 新词识别研究第13-19页
   ·新词识别特征选取第13-15页
     ·新词的语言知识特征第13-14页
     ·新词的统计特征第14-15页
   ·候选新词集合构造第15-17页
     ·基于分词的方法第15页
     ·基于启发式规则的方法第15页
     ·基于重复串的方法第15-17页
   ·新词检测技术第17-18页
     ·基于规则的方法第17页
     ·基于统计的方法第17页
     ·统计与规则相结合的方法第17-18页
   ·评测标准第18页
   ·本章小结第18-19页
第三章 基于Helmholtz原理的时间分布特性第19-24页
   ·Helmholtz原理及有意义事件第19-22页
     ·有意义事件描述第20-21页
     ·文档语料长度调整第21-22页
     ·算法步骤第22页
   ·验证实验第22-23页
   ·本章小结第23-24页
第四章 基于SVM的新词检测方法第24-34页
   ·支持向量机(Support Vector Machine;SVM)第24-27页
     ·线性可分SVM第24-26页
     ·线性不可分SVM第26页
     ·SVM核函数第26-27页
   ·新词识别的总体流程图第27-28页
   ·成词重复串逐层剪枝提取算法第28-31页
     ·算法思想第28-30页
     ·重复串提取实验第30-31页
   ·训练语料标注及归一化第31-33页
   ·本章小结第33-34页
第五章 实验及结果分析第34-37页
   ·LIBSVM第34页
   ·验证实验第34-35页
   ·实验分析第35-36页
   ·本章小结第36-37页
第六章 结论与展望第37-39页
   ·结论第37-38页
   ·展望第38-39页
参考文献第39-41页
致谢第41页

论文共41页,点击 下载论文
上一篇:基于OCR快递单据识别的研究与实现
下一篇:基于Android的蒙文基本控件的设计与实现