摘要 | 第1-6页 |
ABSTRACT | 第6-10页 |
第1章 绪论 | 第10-12页 |
·研究背景及现状 | 第10页 |
·课题研究意义 | 第10页 |
·本论文的主要内容及结构 | 第10-12页 |
第2章 全文检索技术研究 | 第12-15页 |
·概述 | 第12页 |
·检索的发展过程 | 第12页 |
·全文检索技术的发展 | 第12页 |
·全文检索系统 | 第12页 |
·分布式索引技术 | 第12-14页 |
·分布式索引系统的特点 | 第12-13页 |
·分布式索引系统的类型 | 第13页 |
·分布式索引系统中索引的组织和获取 | 第13-14页 |
·小结 | 第14-15页 |
第3章 汉语自动分词机制 | 第15-24页 |
·中文分词技术 | 第15页 |
·五种传统分词方法 | 第15-17页 |
·机械匹配法 | 第15页 |
·特征词库法 | 第15-16页 |
·约束矩阵法 | 第16页 |
·语法分析法 | 第16页 |
·理解切分法 | 第16页 |
·小结 | 第16-17页 |
·汉语自动分词词典机制 | 第17-19页 |
·早期汉语词典组织方法 | 第17页 |
·基于整词二分的词典机制 | 第17页 |
·基于TRIE 索引树的词典机制 | 第17-18页 |
·基于逐字二分法的查询机制 | 第18页 |
·基于双字哈希机制的词典查询方法 | 第18页 |
·基于PATRICIA tree 的汉语词典查询方法 | 第18页 |
·基于四字哈希机制的中文分词查询机制 | 第18页 |
·基于双数组Trie 查询算法的词典查询机制 | 第18-19页 |
·小结 | 第19页 |
·改进的三数组TRIE索引树的词典查询机制 | 第19-24页 |
·常用字符哈希表及构词状态表 | 第19-20页 |
·查询过程 | 第20-21页 |
·构词状态表的构建算法 | 第21-24页 |
第4章 局部索引分布策略的研究 | 第24-27页 |
·引言 | 第24页 |
·分布式索引的系统结构 | 第24-25页 |
·分布式体系结构 | 第24页 |
·分布式索引系统结构 | 第24-25页 |
·索引数据的分配策略 | 第25页 |
·并行索引查询策略 | 第25-26页 |
·性能分析 | 第26页 |
·小结 | 第26-27页 |
第5章 搜索引擎系统设计方案 | 第27-32页 |
·全文搜索引擎应具备的特点 | 第27-29页 |
·丰富的采集接口 | 第27页 |
·海量复杂数据结构的搜索 | 第27页 |
·高速、准确搜集技术 | 第27-28页 |
·智能化的检索服务 | 第28页 |
·强大的可扩展能力 | 第28页 |
·多层次的鲁棒性保护 | 第28-29页 |
·搜索引擎架构 | 第29-32页 |
·控制中心 | 第30页 |
·查询代理 | 第30页 |
·搜集代理 | 第30页 |
·查询搜集子系统 | 第30-31页 |
·信息获取器 | 第31-32页 |
第6章 全文搜索引擎的实现 | 第32-41页 |
·全文检索系统结构 | 第32-33页 |
·体系结构 | 第32页 |
·拓扑结构 | 第32-33页 |
·建立索引 | 第33页 |
·索引查询 | 第33-34页 |
·系统安装 | 第34-36页 |
·系统状态检测 | 第36-37页 |
·系统运行结果 | 第37-41页 |
结论 | 第41-42页 |
参考文献 | 第42-46页 |
致谢 | 第46-47页 |
附录A 攻读学位期间所发表的学术论文目录 | 第47页 |