基于论坛语料的未登录词自动识别新方法

摘要	第1-5页
Abstract	第5-7页
第一章绪论	第7-17页
·研究背景与意义	第7-8页
·研究现状及问题	第8-13页
·中文分词的规范问题	第8-9页
·中文分词的瓶颈问题	第9-10页
·早期的自动分词系统对未登录词的研究	第10-13页
·研究目标及内容	第13-14页
·研究的技术路线	第14-16页
·本章小结	第16-17页
第二章未登录词识别的语料问题	第17-26页
·语料对象的选择	第17-18页
·语料提取的关键技术	第18-20页
·语料库的构建	第20-24页
·语料库和词表的更新策略	第24-25页
·本章小结	第25-26页
第三章未登录词识别的MD算法	第26-31页
·MD算法的核心思想	第26-27页
·MD算法的技术策略	第27-29页
·MD算法的效率评价	第29页
·本章小结	第29-31页
第四章未登录词识别的试验测试	第31-41页
·试验设计的依据	第31页
·试验的具体方案	第31-37页
·试验结果的比较分析	第37-40页
·本章小结	第40-41页
第五章结论	第41-42页
·算法的主要创新成果	第41页
·算法的主要缺陷及改进思路	第41-42页
参考文献	第42-45页
致谢	第45-46页
攻读学位期间所发表的学术论文和研究成果	第46页