“隐性小词表＋专业小词库”的自动分词技术研究

摘要	第1-4页
ABSTRACT	第4-8页
1 引言	第8-16页
·汉语自动分词技术研究的意义	第8-9页
·汉语书面语自动分词系统研究现状	第9-13页
·几个早期的自动分词系统	第10页
·SEG分词系统和SEGTAG系统	第10-11页
·复旦分词系统	第11页
·哈尔滨工业大学统计分词系统	第11页
·Microsoft Research汉语句法分析器中的自动分词	第11-12页
·北大计算语言所分词系统	第12页
·罗海清的"生成性隐性小词表"汉语自动分词系统	第12-13页
·主要的自动分词算法	第13-16页
·基于字符串匹配的分词方法	第13-14页
·基于理解的分词方法	第14-15页
·基于统计的分词方法	第15-16页
·研究方法和资料来源	第16页
2 "生成性隐性小词表"分词系统	第16-31页
·"生成性隐性小词表"概述	第16-24页
·"生成性隐性小词表"的基本原理	第17-18页
·分词程序	第18-19页
·基本算法	第19-24页
·"生成性隐性小词表"的优势和局限	第24-30页
·"生成性隐性小词表"分词系统的优势	第24-30页
·"生成性隐性小词表"分词系统需要完善的问题	第30页
·改进的方面和潜力	第30-31页
3 文本的预处理和专业小词库	第31-41页
·预处理的原理及其模式	第31-33页
·预处理的原理	第31-32页
·"预处理+专业小词库"的分词模式	第32-33页
·专业小词库的具体示例	第33-40页
·样本选择及语料库的建设	第33-35页
·分词处理	第35-36页
·词频统计	第36-38页
·专业小词库	第38-40页
·"隐性小词表+专业小词库"的分词模式	第40-41页
4 总结	第41-42页
5 附录	第42-60页
参考文献	第60-63页
攻读硕士期间科研及发表的学术论文	第63-64页
致谢	第64-67页