| 摘要 | 第1-6页 |
| ABSTRACT | 第6-10页 |
| 第1章 绪论 | 第10-12页 |
| ·研究背景及现状 | 第10页 |
| ·课题研究意义 | 第10页 |
| ·本论文的主要内容及结构 | 第10-12页 |
| 第2章 全文检索技术研究 | 第12-15页 |
| ·概述 | 第12页 |
| ·检索的发展过程 | 第12页 |
| ·全文检索技术的发展 | 第12页 |
| ·全文检索系统 | 第12页 |
| ·分布式索引技术 | 第12-14页 |
| ·分布式索引系统的特点 | 第12-13页 |
| ·分布式索引系统的类型 | 第13页 |
| ·分布式索引系统中索引的组织和获取 | 第13-14页 |
| ·小结 | 第14-15页 |
| 第3章 汉语自动分词机制 | 第15-24页 |
| ·中文分词技术 | 第15页 |
| ·五种传统分词方法 | 第15-17页 |
| ·机械匹配法 | 第15页 |
| ·特征词库法 | 第15-16页 |
| ·约束矩阵法 | 第16页 |
| ·语法分析法 | 第16页 |
| ·理解切分法 | 第16页 |
| ·小结 | 第16-17页 |
| ·汉语自动分词词典机制 | 第17-19页 |
| ·早期汉语词典组织方法 | 第17页 |
| ·基于整词二分的词典机制 | 第17页 |
| ·基于TRIE 索引树的词典机制 | 第17-18页 |
| ·基于逐字二分法的查询机制 | 第18页 |
| ·基于双字哈希机制的词典查询方法 | 第18页 |
| ·基于PATRICIA tree 的汉语词典查询方法 | 第18页 |
| ·基于四字哈希机制的中文分词查询机制 | 第18页 |
| ·基于双数组Trie 查询算法的词典查询机制 | 第18-19页 |
| ·小结 | 第19页 |
| ·改进的三数组TRIE索引树的词典查询机制 | 第19-24页 |
| ·常用字符哈希表及构词状态表 | 第19-20页 |
| ·查询过程 | 第20-21页 |
| ·构词状态表的构建算法 | 第21-24页 |
| 第4章 局部索引分布策略的研究 | 第24-27页 |
| ·引言 | 第24页 |
| ·分布式索引的系统结构 | 第24-25页 |
| ·分布式体系结构 | 第24页 |
| ·分布式索引系统结构 | 第24-25页 |
| ·索引数据的分配策略 | 第25页 |
| ·并行索引查询策略 | 第25-26页 |
| ·性能分析 | 第26页 |
| ·小结 | 第26-27页 |
| 第5章 搜索引擎系统设计方案 | 第27-32页 |
| ·全文搜索引擎应具备的特点 | 第27-29页 |
| ·丰富的采集接口 | 第27页 |
| ·海量复杂数据结构的搜索 | 第27页 |
| ·高速、准确搜集技术 | 第27-28页 |
| ·智能化的检索服务 | 第28页 |
| ·强大的可扩展能力 | 第28页 |
| ·多层次的鲁棒性保护 | 第28-29页 |
| ·搜索引擎架构 | 第29-32页 |
| ·控制中心 | 第30页 |
| ·查询代理 | 第30页 |
| ·搜集代理 | 第30页 |
| ·查询搜集子系统 | 第30-31页 |
| ·信息获取器 | 第31-32页 |
| 第6章 全文搜索引擎的实现 | 第32-41页 |
| ·全文检索系统结构 | 第32-33页 |
| ·体系结构 | 第32页 |
| ·拓扑结构 | 第32-33页 |
| ·建立索引 | 第33页 |
| ·索引查询 | 第33-34页 |
| ·系统安装 | 第34-36页 |
| ·系统状态检测 | 第36-37页 |
| ·系统运行结果 | 第37-41页 |
| 结论 | 第41-42页 |
| 参考文献 | 第42-46页 |
| 致谢 | 第46-47页 |
| 附录A 攻读学位期间所发表的学术论文目录 | 第47页 |