基于Helmholtz原理的中文新词识别

摘要	第1-5页
ABSTRACT	第5-9页
第一章绪论	第9-13页
·研究背景及意义	第9页
·新词的定义及特点	第9-11页
·新词的定义	第9-10页
·新词的特点	第10-11页
·新词识别的难点	第11页
·本文的研究内容与结构安排	第11-13页
第二章新词识别研究	第13-19页
·新词识别特征选取	第13-15页
·新词的语言知识特征	第13-14页
·新词的统计特征	第14-15页
·候选新词集合构造	第15-17页
·基于分词的方法	第15页
·基于启发式规则的方法	第15页
·基于重复串的方法	第15-17页
·新词检测技术	第17-18页
·基于规则的方法	第17页
·基于统计的方法	第17页
·统计与规则相结合的方法	第17-18页
·评测标准	第18页
·本章小结	第18-19页
第三章基于Helmholtz原理的时间分布特性	第19-24页
·Helmholtz原理及有意义事件	第19-22页
·有意义事件描述	第20-21页
·文档语料长度调整	第21-22页
·算法步骤	第22页
·验证实验	第22-23页
·本章小结	第23-24页
第四章基于SVM的新词检测方法	第24-34页
·支持向量机(Support Vector Machine；SVM)	第24-27页
·线性可分SVM	第24-26页
·线性不可分SVM	第26页
·SVM核函数	第26-27页
·新词识别的总体流程图	第27-28页
·成词重复串逐层剪枝提取算法	第28-31页
·算法思想	第28-30页
·重复串提取实验	第30-31页
·训练语料标注及归一化	第31-33页
·本章小结	第33-34页
第五章实验及结果分析	第34-37页
·LIBSVM	第34页
·验证实验	第34-35页
·实验分析	第35-36页
·本章小结	第36-37页
第六章结论与展望	第37-39页
·结论	第37-38页
·展望	第38-39页
参考文献	第39-41页
致谢	第41页