单汉字全文检索技术研究

第一章绪论	第1-9页
§1-1 选题背景及意义	第7页
§1-2 本文研究内容	第7-8页
§1-3 本文结构	第8-9页
第二章全文检索概述	第9-12页
§2-1 全文检索技术的基本概念	第9页
§2-2 全文检索的发展过程	第9-10页
§2-3 全文检索前沿	第10页
§2-4 全文检索系统的衡量指标	第10-12页
第三章全文检索关键技术	第12-20页
§3-1 全文数据库组织与索引技术	第12-14页
3-1-1 分词技术	第12页
3-1-2 组织索引技术	第12-14页
§3-2 全文检索模型	第14-15页
3-2-1 布尔逻辑模型	第14页
3-2-2 模糊逻辑模型	第14页
3-2-3 向量空间模型	第14页
3-3-4 概率模型	第14-15页
§3-3 中文全文检索技术	第15-20页
3-3-1 中英文全文检索的区别	第15页
3-3-2 基于分词的全文检索研究	第15-17页
3-3-3 基于单字的全文检索研究	第17-18页
3-3-4 中文全文检索算法的比较结论	第18-20页
第四章单汉字全文检索的优化研究	第20-28页
§4-1 现有的索引技术	第20-22页
4-1-1 静态索引技术	第20-21页
4-1-2 动态索引技术	第21-22页
§4-2 单汉字索引结构的改进	第22-28页
4-2-1 目前倒排索引技术的不足	第22-23页
4-2-2 倒排索引的改进思路	第23-24页
4-2-3 模型数据结构描述	第24-26页
4-2-4 创建／插入索引模型描述	第26页
4-2-5 检索模型描述	第26-27页
4-2-6 总结	第27-28页
第五章利用单汉字全文检索技术实现局域网内的搜索	第28-39页
§5-1 局域网搜索引擎的产生环境	第28-29页
5-1-1 Internet网上搜索引擎用于局域网的弊端	第28页
5-1-2 构造局域网搜索引擎的可行性	第28-29页
§5-2 搜索引擎工作原理	第29页
§5-3 网页获取技术	第29页
§5-4 超文本分析处理	第29-34页
5-4-1 网页文档结构特征	第29-30页
5-4-2 超文本标记的一般处理	第30-31页
5-4-3 标记加权及权值存储的实现	第31-33页
5-4-4 HTML的标准化	第33-34页
§5-5 网络爬行者技术	第34-37页
5-5-1 网络爬行基本原理	第34页
5-5-2 本系统网络爬行的具体实现	第34-36页
5-5-3 信息更新	第36-37页
§5-6 检索结果排序	第37-38页
§5-7 对中文搜索引擎发展的几点建议	第38-39页
第六章系统部分算法实现	第39-44页
§6-1 实验环境	第39页
§6-2 获取网页源文件	第39页
§6-3 超文本标引算法实现	第39-41页
§6-4 检索算法的部分实现	第41-44页
第七章总结	第44-45页
参考文献	第45-47页
致谢	第47页