首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

策略可扩展的搜索引擎研究和实现

中文摘要第1-4页
Abstract第4-6页
目录第6-10页
第1章 引言第10-20页
   ·研究背景第10-11页
   ·文献综述与研究现状第11-17页
     ·搜索策略第11-13页
     ·网页排序第13-14页
     ·系统构造第14-15页
     ·搜索过程中对Web 信息的利用第15-16页
     ·解决Web 发展中出现的新问题第16-17页
     ·Web 网页的分类第17页
   ·论文动机和贡献第17-18页
   ·论文组织第18-20页
第2章 搜索引擎结构第20-24页
   ·搜索引擎的分类第20-21页
     ·基于查询串的搜索引擎第20页
     ·目录搜索引擎第20-21页
     ·元搜索引擎第21页
   ·典型搜索引擎的结构第21-23页
     ·Alta Vista 搜索引擎第21页
     ·Harvest 搜索引擎第21-22页
     ·Google 搜索引擎第22-23页
   ·总结:搜索引擎的一般结构第23-24页
第3章 网络爬行器(Crawler)第24-33页
   ·概述第24页
   ·Web 网的构成和爬行器(Cralwer)的选择第24-26页
   ·聚焦搜索第26-29页
     ·系统架构第27-28页
     ·关键技术第28-29页
   ·隐藏Web 网搜索第29-32页
     ·基本架构第30-31页
     ·关键技术第31-32页
   ·小结第32-33页
第4章 Webob-Crawler 架构设计第33-58页
   ·Mercator 网络爬行器第33-36页
     ·总体架构第34-35页
     ·模块介绍第35-36页
   ·Webob-Crawler 的设计目标和设计思想第36-38页
   ·Webob-Crawler 总体结构第38-40页
   ·Webob-Crawler 各模块及接口的设计第40-50页
     ·任务和任务库(Task Repository)第40-44页
     ·协议模块(Protocol)第44-47页
     ·处理模块(Process)第47-48页
     ·策略模块(Strategy)第48-49页
     ·处理模块和策略模块之间的接口第49-50页
   ·Webob-Crawler 中有关算法的设计第50-54页
     ·URL 散列算法第50-53页
     ·线程调度算法第53页
     ·任务预取和缓存的双窗口算法第53-54页
   ·实验结果第54-56页
     ·聚焦搜索实验第54-55页
     ·稳定性和伸缩性实验第55-56页
   ·小结与进一步的工作第56-58页
第5章 文本分类器Webob-Classifier 的设计第58-71页
   ·引言第58-59页
   ·文本处理(Text Processing)和特征抽取第59-62页
     ·分词第60-61页
     ·词的处理第61页
     ·索引第61-62页
   ·分类算法第62-63页
   ·文本分类系统构造第63-69页
     ·总体结构及处理流程第64-65页
     ·文本分析模块(Analyzer)第65-67页
     ·索引模块第67页
     ·分类器模块第67-69页
   ·实验及结果评价第69-70页
   ·结论与未来工作第70-71页
第6章 全文检索系统Webob-Index 设计第71-81页
   ·Lucene 系统架构第71-73页
   ·Lucene 索引文件格式第73-77页
     ·基本概念第75-76页
     ·索引的总体结构第76页
     ·索引的组成第76-77页
   ·Webob 中的全文检索系统第77-80页
     ·基于Lucene 的架构设计第77-78页
     ·索引文件格式的改进第78-80页
     ·对中文处理的支持第80页
   ·小结第80-81页
第7章 搜索引擎系统的集成第81-83页
   ·系统集成第81-82页
   ·系统运行结果第82-83页
第8章 结论第83-85页
   ·论文主要工作总结第83-84页
   ·进一步工作展望第84-85页
参考文献第85-89页
致谢第89页
声明第89-90页
本人简历第90页
在学期间的研究成果及发表的学术论文第90页

论文共90页,点击 下载论文
上一篇:熊果酸抗肿瘤作用的实验研究
下一篇:末次间冰期北京西山高分辨率植被演化与环境变迁研究