校园网搜索引擎核心技术—中文自动分词

摘要	第1-4页
ABSTRACT	第4-8页
第1章引言	第8-14页
·校园网搜索引擎课题背景	第8-12页
·校园网搜索引擎基本原理	第8-9页
·校园网搜索引擎的特点	第9-10页
·中文分词的地位与作用	第10页
·中文分词模型	第10-11页
·中文分词子课题研究面临的难题	第11-12页
·本文研究工作的概述	第12-14页
·研究思路	第13页
·论文的组织	第13-14页
第2章中文自动分词子系统模型	第14-20页
·中文自动分词子系统模型简介	第14-15页
·数据接口	第15-18页
·中文分词子系统评价标准	第18-19页
·准确率	第18页
·速度	第18-19页
·内存占用量	第19页
·小结	第19-20页
第3章基于整词二分的二层索引结构	第20-31页
·词典机制概述	第20-22页
·整词二分的词典机制	第20-21页
·TRIE 索引树的词典机制	第21-22页
·基于TRIE 索引树四层结构的词典机制	第22-24页
·索引树的结点结构	第22-23页
·查询算法	第23-24页
·基于整词二分的二层索引结构的词典机制	第24-26页
·基于整词二分的二层索引结构	第24-25页
·查询算法	第25-26页
·两种词典机制的性能比较	第26-27页
·中文分词子系统的词典机制	第27-30页
·词典的文件组织	第27-29页
·词典的类组织	第29-30页
·小结	第30-31页
第4章基于规则统计的未登录词识别	第31-35页
·规则的定义	第31-32页
·人名识别规则	第31页
·机构识别规则	第31-32页
·连续单字识别规则	第32页
·词频统计	第32页
·基于规则统计的未登录词识别算法	第32-34页
·规则库的定义	第32-33页
·数据结构	第33页
·基于规则统计的识别算法	第33-34页
·小结	第34-35页
第5章逆向最大匹配分词算法的改进	第35-43页
·分词算法的研究	第35-37页
·机械分词算法	第35页
·基于统计语言模型的分词算法	第35-36页
·基于语义理解的分词算法	第36页
·三种分词算法的比较	第36-37页
·校园网搜索引擎分词算法的选择	第37-38页
·逆向最大匹配分词算法的改进	第38-41页
·逆向最大匹配改进算法流程图	第38页
·逆向词库的使用	第38-40页
·增加最大长度字段	第40页
·剔除停用词	第40-41页
·分词算法的类图	第41页
·小结	第41-43页
第6章中文分词子系统的实现	第43-51页
·现有中文分词系统	第43页
·系统实现的说明	第43-45页
·系统类图的组织	第43-44页
·系统类图的说明	第44-45页
·用户界面	第45-49页
·性能测试	第49-50页
·速度测试	第49页
·占用内存空间测试	第49-50页
·小结	第50-51页
第7章结论与展望	第51-53页
·结论	第51页
·展望	第51-53页
致谢	第53-54页
参考文献	第54-58页
个人简历在读期间发表的学术论文与研究成果	第58-59页
详细摘要	第59-62页
ABSTRACT	第62-65页