化工类专业搜索引擎中的中文分词设计
| 一 课题的研究背景 | 第1-12页 |
| 二 搜索引擎技术简介 | 第12-18页 |
| ·互联网发展现状 | 第12页 |
| ·搜索引擎的发展历史 | 第12-15页 |
| ·第0代搜索引擎 | 第12-13页 |
| ·第1代搜索引擎 | 第13-14页 |
| ·第2代搜索引擎 | 第14-15页 |
| ·搜索引擎的原理 | 第15页 |
| ·搜索引擎的组成 | 第15-16页 |
| ·搜索引擎的分类 | 第16-17页 |
| ·目录式搜索引擎 | 第16-17页 |
| ·机器人搜索引擎 | 第17页 |
| ·元搜索引擎 | 第17页 |
| ·中文搜索引擎的特点简述 | 第17-18页 |
| 三 中文分词技术 | 第18-22页 |
| ·简介 | 第18页 |
| ·中文分词中的难点 | 第18-20页 |
| ·分词歧义 | 第18-19页 |
| ·未登录词识别 | 第19-20页 |
| ·中文分词算法的分类 | 第20-22页 |
| ·基于字符串匹配的分词方法 | 第20-21页 |
| ·基于理解的分词方法 | 第21页 |
| ·基于统计的分词方法 | 第21-22页 |
| 四 层进式最短路径中文分词算法研究 | 第22-26页 |
| ·数学模型 | 第22-23页 |
| ·模型构造 | 第22-23页 |
| ·层进式最短路径方法中的最佳路径 | 第23页 |
| ·最佳路径求解 | 第23-24页 |
| ·当前算法实现中的有关问题 | 第24页 |
| ·与最短路径法和正向最大匹配法的比较分析 | 第24-26页 |
| 五 中文分词模块结构设计 | 第26-40页 |
| ·简介 | 第26-27页 |
| ·分词模块的功能 | 第26页 |
| ·分词模块的组成 | 第26-27页 |
| ·分词词典 | 第27-29页 |
| ·比较器 | 第27-28页 |
| ·Query对象 | 第28页 |
| ·词典组织结构类 | 第28-29页 |
| ·对象池框架及线程池 | 第29-32页 |
| ·对象复用框架中有关类和接口 | 第30-31页 |
| ·线程池 | 第31-32页 |
| ·分词实现的结构介绍 | 第32-40页 |
| ·面向索引模块的外部接口 | 第33页 |
| ·分词用对象的复用 | 第33-34页 |
| ·索引与分词线程的独立 | 第34-36页 |
| ·分词算法实现和字符数组缓冲 | 第36-40页 |
| 六 分词算法的实现 | 第40-49页 |
| ·组词信息的查询策略 | 第40页 |
| ·算法具体实现的数据结构 | 第40-43页 |
| ·NodeRegistEntry对象 | 第41页 |
| ·Node对象 | 第41-42页 |
| ·NodeParameter类 | 第42-43页 |
| ·Slice对象 | 第43页 |
| ·算法实现 | 第43-49页 |
| ·分词结果输出 | 第44页 |
| ·分词过程中的状态 | 第44-46页 |
| ·算法实现的流程图 | 第46-49页 |
| 七 总结 | 第49-50页 |
| 参考文献 | 第50-53页 |
| 致谢 | 第53-54页 |
| 攻读学位期间发表的学术论文目录 | 第54页 |