基于带词长和规则判定的中文分词技术的研究

摘要	第1-4页
ABSTRACT	第4-6页
目录	第6-8页
1、绪论	第8-13页
·研究背景和研究意义	第8-9页
·研究现状	第9-10页
·本文的主要研究内容	第10-11页
·本文的组织结构	第11-13页
2、对中文分词中的相关技术的研究	第13-31页
·中文分词的主要分词算法	第13-22页
·基于字符串匹配的分词算法	第13-17页
·基于词典的分词算法	第17页
·基于统计的分词算法	第17-20页
·基于规则的分词算法	第20-21页
·基于理解的分词算法	第21页
·基于语义的分词方法	第21-22页
·对中文分词词典机制的研究	第22-28页
·基于整词二分的中文分词词典机制	第22-24页
·基于TRIE索引树的中文分词词典机制	第24-25页
·基于逐字二分的中文分词词典机制	第25-26页
·基于哈希算法的中文分词词典机制	第26-27页
·四种中文分词词典机制的性能比较	第27-28页
·中文分词需要解决的关键问题	第28-29页
·分词结果中歧义的识别	第28-29页
·未登录词的识别	第29页
·中文分词的性能指标	第29-30页
·本章小结	第30-31页
3、带词长的中文分词算法	第31-38页
·现有的哈希词典机制	第31-33页
·基于哈希的中文分词词典机制	第31-32页
·多级哈希词典机制	第32-33页
·带词长的中文分词算法	第33-37页
·本章小结	第37-38页
4、对切分歧义的处理	第38-47页
·产生歧义的原因	第38-39页
·切分歧义的分类	第39-40页
·如何检索交集型歧义	第40-43页
·双向最大匹配检索法	第40-41页
·逐词扫描的最大匹配法	第41-42页
·最长词次长词发现法	第42-43页
·歧义字段的消解	第43-46页
·概率统计型歧义消解算法	第43-44页
·基于规则的歧义消解算法	第44页
·改进的歧义消解算法	第44-46页
·本章小结	第46-47页
5 中文分词系统的设计	第47-62页
·中文分词系统的设计原则	第47-48页
·中文分词系统的设计	第48-59页
·预处理模块的实现	第50-52页
·中文分词算法的实现	第52-55页
·歧义消解算法的实现	第55-59页
·实验分析	第59-61页
·本章小结	第61-62页
6. 总结和展望	第62-64页
参考文献	第64-68页
致谢	第68-69页
攻读学位期间发表的学术论文目录	第69-70页