互联网信息分布式深度搜索的研究

第1章绪论	第1-11页
·课题背景	第9页
·课题研究的主要内容	第9-10页
·本文安排	第10-11页
第2章搜索引擎研究	第11-15页
·搜索引擎起源	第11页
·搜索引擎发展和现状	第11-12页
·搜索引擎原理	第12-13页
·搜索引擎分类	第13页
·搜索引擎算法	第13-14页
·本章小结	第14-15页
第3章深度搜索的Web信息采集系统	第15-37页
·基本原理	第15页
·基本结构	第15-18页
·URL处理器	第15-16页
·协议处理器	第16-17页
·重复内容检测器	第17页
·URL提取器	第17页
·Meta信息获取器	第17页
·语义信息解析器	第17-18页
·数据库	第18页
·Web信息采集面临的主要困难和相应的技术手段	第18-19页
·Web的特点	第18页
·Web采集面临的技术困难和相应手段	第18-19页
·Web采集系统的基本结构和工作过程	第19-20页
·Web信息采集系统模型	第20-21页
·模型中的关键问题	第21-23页
·Spider采集	第21-22页
·页面分析	第22页
·URL的相关性判定链接过滤/链接预测	第22页
·页面的相关性判定页面过滤	第22页
·数据存储	第22-23页
·刷新问题	第23页
·Spider采集	第23-28页
·Spider的系统模型	第24-25页
·采集算法及实现	第25-28页
·采集数据的组织	第28页
·页面分析	第28-31页
·HTML语法分析	第29-30页
·页面中正文的提取	第30页
·页面中链接的提取	第30-31页
·Web信息采集系统的Delphi实现	第31-36页
·本章小结	第36-37页
第4章深度搜索的信息整理系统	第37-48页
·全文本扫描	第37-38页
·高效匹配算法	第38-47页
·过滤词技术	第47页
·本章小结	第47-48页
第5章深度搜索的信息存储和信息检索	第48-55页
·信息存储的主要部分	第48-51页
·信息检索技术研究	第51-53页
·深度搜索的信息检索设计	第53页
·分布式深度搜索的研究	第53-54页
·本章小结	第54-55页
第6章系统的实现与总结	第55-66页
·系统简介	第55-56页
·系统功能介绍	第56-65页
·登录系统	第57-58页
·运行步骤	第58-65页
·进一步需要研究的问题	第65页
·本章小结	第65-66页
结论	第66-67页
参考文献	第67-70页
攻读硕士学位期间发表的论文和取得的科研成果	第70-71页
致谢	第71页