基于机器学习的中文分词的研究与实现

摘要	第1-6页
Abstract	第6-10页
第一章绪论	第10-20页
·课题研究背景及意义	第10页
·国内外研究现状分析	第10-14页
·国际研究动态	第11页
·国内研究动态	第11-14页
·本文主要研究目的和内容	第14-15页
·本文的研究目的	第14-15页
·本文研究的主要内容	第15页
·中文分词概念及难点	第15-17页
·中文分词概念	第15页
·中文分词难点	第15-17页
·中文分词系统的性能评价	第17-20页
·分词精度	第17-18页
·分词速度	第18页
·功能完备性	第18页
·可维护性	第18-19页
·可移植性	第19-20页
第二章相关技术介绍	第20-36页
·机器学习基本概念	第20页
·统计语言模型	第20-25页
·N-gram模型	第21-23页
·HMM(Hidden Markov Model)模型	第23-25页
·数据平滑	第25-26页
·加法平滑	第26页
·Good-Turing估计	第26页
·Katz平滑	第26页
·中文分词现有方法的介绍	第26-30页
·基于词典的中文分词方法	第27-29页
·基于理解的中文分词方法	第29页
·基于统计的中文分词方法	第29-30页
·歧义解决	第30-36页
·歧义采集	第30-31页
·歧义的解决方法	第31-36页
第三章基于机器学习的中文分词系统的设计	第36-48页
·机器学习部分	第36-45页
·环境模块	第37-38页
·学习模块	第38-42页
·知识库模块	第42-45页
·执行模块	第45页
·分词部分	第45-48页
第四章基于机器学习的中文分词系统的实现	第48-54页
·数据库设计	第48-49页
·参数和阈值设置	第49-50页
·词典设计	第50-52页
·关键模块算法	第52-54页
第五章实验结果及分析	第54-59页
·试验数据	第54-55页
·训练数据	第54页
·测试数据	第54-55页
·实验结果	第55-57页
·系统界面	第57-58页
·结果分析	第58-59页
第六章结论	第59-60页
参考文献	第60-62页
在学研究成果	第62-63页
致谢	第63页