首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于支持向量机的中文分词系统的研究

摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-21页
   ·引言第9-10页
   ·机器学习第10-13页
     ·机器学习的基本问题第10-11页
     ·机器学习的发展历史与现状第11-13页
   ·统计学习中的核心理论第13-15页
     ·VC维第13页
     ·推广性的界第13-14页
     ·结构风险最小化第14-15页
   ·中文分词技术第15-19页
     ·中文分词的必要性第15页
     ·中文分词技术的应用第15-18页
     ·中文分词技术的方法第18-19页
   ·本文的研究内容与结构安排第19-21页
第二章 支持向量机第21-32页
   ·支持向量机学习算法第21-24页
     ·最优超平面第21-23页
     ·支持向量机第23页
     ·支持向量机的优点第23-24页
   ·支持向量机算法的研究现状第24-28页
     ·支持向量机算法的研究现状第24-26页
     ·支持向量机模型选择的研究第26-28页
   ·支持向量机的应用第28-29页
   ·其他分类算法第29-32页
     ·KNN算法第29-32页
第三章 支持向量机在中文分词中的应用第32-41页
   ·词频统计的基本原理第32-35页
     ·互信息(Mutual Information)第32-33页
     ·N元统计模型(N—Gram)的原理第33-34页
     ·t-测试(t—test)第34-35页
   ·中文分词技术的关键问题第35-37页
     ·用词表和切分规范第35-36页
     ·歧义切分字段第36页
     ·登录词识别第36-37页
   ·采用支持向量机解决关键问题第37-41页
     ·采用支持向量机的特征取值第37-38页
     ·统计信息的计算第38-39页
     ·SVM—KNN分类器实现第39-41页
第四章 基于支持向量机的中文分词系统的实现第41-56页
   ·总体设计第41-43页
     ·总体模块设计第41页
     ·详细设计第41-42页
     ·核心类图第42-43页
   ·基本操作的实现第43-47页
     ·系统界面第44-45页
     ·文件处理第45-46页
     ·重复处理的判断第46-47页
   ·预处理模块的实现第47-50页
     ·汉字编码及字符类型第47-48页
     ·数据结构第48-50页
   ·词频统计模块的实现第50-52页
     ·单字出现频率统计第50-51页
     ·相邻两字共现频率统计第51-52页
   ·SVM处理模块第52-53页
   ·切分和词典生成模块的实现第53-56页
     ·词典数据结构第53-54页
     ·词典存储第54-56页
第五章 系统集成及试验分析第56-63页
   ·生语料测试第56-57页
   ·试验结果第57-58页
     ·采用SVM的试验结果第57-58页
     ·采用SVM—KNN的试验结果第58页
   ·时间开销分析第58-59页
   ·三种分词原理比较第59-63页
     ·互信息原理第59-60页
     ·N元统计模型第60页
     ·t—测试原理第60-61页
     ·比较分析结果第61-63页
第六章 总结与展望第63-64页
   ·设计总结第63页
   ·设计展望第63-64页
参考文献第64-68页
致谢第68-69页
攻读学位期间主要的研究成果第69页

论文共69页,点击 下载论文
上一篇:基于平衡式差分法的光学电流互感器信号处理系统
下一篇:软开关全桥移相PWM变换器研究