第一章 绪论 | 第1-9页 |
§1-1 选题背景及意义 | 第7页 |
§1-2 本文研究内容 | 第7-8页 |
§1-3 本文结构 | 第8-9页 |
第二章 全文检索概述 | 第9-12页 |
§2-1 全文检索技术的基本概念 | 第9页 |
§2-2 全文检索的发展过程 | 第9-10页 |
§2-3 全文检索前沿 | 第10页 |
§2-4 全文检索系统的衡量指标 | 第10-12页 |
第三章 全文检索关键技术 | 第12-20页 |
§3-1 全文数据库组织与索引技术 | 第12-14页 |
3-1-1 分词技术 | 第12页 |
3-1-2 组织索引技术 | 第12-14页 |
§3-2 全文检索模型 | 第14-15页 |
3-2-1 布尔逻辑模型 | 第14页 |
3-2-2 模糊逻辑模型 | 第14页 |
3-2-3 向量空间模型 | 第14页 |
3-3-4 概率模型 | 第14-15页 |
§3-3 中文全文检索技术 | 第15-20页 |
3-3-1 中英文全文检索的区别 | 第15页 |
3-3-2 基于分词的全文检索研究 | 第15-17页 |
3-3-3 基于单字的全文检索研究 | 第17-18页 |
3-3-4 中文全文检索算法的比较结论 | 第18-20页 |
第四章 单汉字全文检索的优化研究 | 第20-28页 |
§4-1 现有的索引技术 | 第20-22页 |
4-1-1 静态索引技术 | 第20-21页 |
4-1-2 动态索引技术 | 第21-22页 |
§4-2 单汉字索引结构的改进 | 第22-28页 |
4-2-1 目前倒排索引技术的不足 | 第22-23页 |
4-2-2 倒排索引的改进思路 | 第23-24页 |
4-2-3 模型数据结构描述 | 第24-26页 |
4-2-4 创建/插入索引模型描述 | 第26页 |
4-2-5 检索模型描述 | 第26-27页 |
4-2-6 总结 | 第27-28页 |
第五章 利用单汉字全文检索技术实现局域网内的搜索 | 第28-39页 |
§5-1 局域网搜索引擎的产生环境 | 第28-29页 |
5-1-1 Internet网上搜索引擎用于局域网的弊端 | 第28页 |
5-1-2 构造局域网搜索引擎的可行性 | 第28-29页 |
§5-2 搜索引擎工作原理 | 第29页 |
§5-3 网页获取技术 | 第29页 |
§5-4 超文本分析处理 | 第29-34页 |
5-4-1 网页文档结构特征 | 第29-30页 |
5-4-2 超文本标记的一般处理 | 第30-31页 |
5-4-3 标记加权及权值存储的实现 | 第31-33页 |
5-4-4 HTML的标准化 | 第33-34页 |
§5-5 网络爬行者技术 | 第34-37页 |
5-5-1 网络爬行基本原理 | 第34页 |
5-5-2 本系统网络爬行的具体实现 | 第34-36页 |
5-5-3 信息更新 | 第36-37页 |
§5-6 检索结果排序 | 第37-38页 |
§5-7 对中文搜索引擎发展的几点建议 | 第38-39页 |
第六章 系统部分算法实现 | 第39-44页 |
§6-1 实验环境 | 第39页 |
§6-2 获取网页源文件 | 第39页 |
§6-3 超文本标引算法实现 | 第39-41页 |
§6-4 检索算法的部分实现 | 第41-44页 |
第七章 总结 | 第44-45页 |
参考文献 | 第45-47页 |
致谢 | 第47页 |