基础教育资源搜索引擎中的中文分词技术研究

摘要	第1-6页
ABSTRACT	第6-7页
前言	第7-9页
1、研究背景	第7-8页
2、主要研究的内容	第8页
3、研究的成果	第8页
4、创新之点	第8页
5、本文的组织结构	第8-9页
第一章中文分词概述	第9-15页
·中文分词技术的发展	第9-10页
·中文分词技术的分类	第10-11页
·分词技术的关键点	第11-12页
·中文分词的困难	第12-13页
·中文分词与搜索引擎	第13-15页
第二章高频特征词与歧义词处理	第15-22页
·歧义的分类及现有的处理的方法	第15-16页
·以特征词为标记的交集歧义切分	第16-22页
·高频特征词的概念	第17页
·交集歧义类型分析	第17-18页
·含高频特征词的歧义词串处理策略	第18-21页
·实验数据	第21-22页
第三章中文分词技术与未登录词处理	第22-36页
·现有未登录词处理技术	第22-23页
·中文姓名识别处理策略	第23-31页
·关于姓名的统计	第25-26页
·关于用名的统计	第26-27页
·关于姓名后常用词的统计	第27-28页
·中文姓名识别过程中遇到的几种类型	第28页
·中文姓名识别处理办法	第28-31页
·高频未登录词的识别处理策略	第31-36页
·研究现状	第31页
·数据结构定义	第31-32页
·用来存贮高频词的Hash表	第32页
·算法思想流程描述	第32-34页
·高频词的处理	第34-35页
·高频未登录词实验	第35-36页
第四章中文分词系统的设计与实现	第36-46页
·系统框架设计	第36-41页
·功能描述：	第36页
·机械匹配分词算法：	第36-38页
·分词系统结构图：	第38页
·类模块介绍及类图设计	第38-41页
·模块流程图	第41-42页
·歧义识别模块流程图	第41页
·未登录词程序模块流程图	第41-42页
·分词接口设计	第42-46页
·接口设计主要考虑因素：	第42页
·用户调用分词动态库方法：	第42-43页
·分词构造函数重载说明：	第43-44页
·分词测试界面	第44页
·分词系统的评价	第44-46页
结语	第46-48页
1、本文总结	第46-47页
2、下一步的任务	第47-48页
参考文献	第48-50页
致谢	第50-51页
附录	第51-54页