化工类专业搜索引擎中的中文分词设计
一 课题的研究背景 | 第1-12页 |
二 搜索引擎技术简介 | 第12-18页 |
·互联网发展现状 | 第12页 |
·搜索引擎的发展历史 | 第12-15页 |
·第0代搜索引擎 | 第12-13页 |
·第1代搜索引擎 | 第13-14页 |
·第2代搜索引擎 | 第14-15页 |
·搜索引擎的原理 | 第15页 |
·搜索引擎的组成 | 第15-16页 |
·搜索引擎的分类 | 第16-17页 |
·目录式搜索引擎 | 第16-17页 |
·机器人搜索引擎 | 第17页 |
·元搜索引擎 | 第17页 |
·中文搜索引擎的特点简述 | 第17-18页 |
三 中文分词技术 | 第18-22页 |
·简介 | 第18页 |
·中文分词中的难点 | 第18-20页 |
·分词歧义 | 第18-19页 |
·未登录词识别 | 第19-20页 |
·中文分词算法的分类 | 第20-22页 |
·基于字符串匹配的分词方法 | 第20-21页 |
·基于理解的分词方法 | 第21页 |
·基于统计的分词方法 | 第21-22页 |
四 层进式最短路径中文分词算法研究 | 第22-26页 |
·数学模型 | 第22-23页 |
·模型构造 | 第22-23页 |
·层进式最短路径方法中的最佳路径 | 第23页 |
·最佳路径求解 | 第23-24页 |
·当前算法实现中的有关问题 | 第24页 |
·与最短路径法和正向最大匹配法的比较分析 | 第24-26页 |
五 中文分词模块结构设计 | 第26-40页 |
·简介 | 第26-27页 |
·分词模块的功能 | 第26页 |
·分词模块的组成 | 第26-27页 |
·分词词典 | 第27-29页 |
·比较器 | 第27-28页 |
·Query对象 | 第28页 |
·词典组织结构类 | 第28-29页 |
·对象池框架及线程池 | 第29-32页 |
·对象复用框架中有关类和接口 | 第30-31页 |
·线程池 | 第31-32页 |
·分词实现的结构介绍 | 第32-40页 |
·面向索引模块的外部接口 | 第33页 |
·分词用对象的复用 | 第33-34页 |
·索引与分词线程的独立 | 第34-36页 |
·分词算法实现和字符数组缓冲 | 第36-40页 |
六 分词算法的实现 | 第40-49页 |
·组词信息的查询策略 | 第40页 |
·算法具体实现的数据结构 | 第40-43页 |
·NodeRegistEntry对象 | 第41页 |
·Node对象 | 第41-42页 |
·NodeParameter类 | 第42-43页 |
·Slice对象 | 第43页 |
·算法实现 | 第43-49页 |
·分词结果输出 | 第44页 |
·分词过程中的状态 | 第44-46页 |
·算法实现的流程图 | 第46-49页 |
七 总结 | 第49-50页 |
参考文献 | 第50-53页 |
致谢 | 第53-54页 |
攻读学位期间发表的学术论文目录 | 第54页 |