首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

设计和实现一个主题搜索引擎

摘要第1-3页
ABSTRACT第3-7页
引言第7-9页
一 主题搜索引擎综述第9-23页
   ·主题搜索引擎的概念第9-11页
   ·用户主题的描述和网页分类器的设计第11-14页
     ·用户主题的描述方式第12-13页
     ·网页分类器的设计第13-14页
   ·主题搜索引擎启发函数的设计第14-18页
   ·主题搜索引擎中的穿越隧道问题第18-23页
     ·样例驱动的主题爬行器第18-19页
     ·上下文图主题爬行器第19-21页
     ·Cora爬行器第21-23页
二 本文主题搜索引擎的体系结构第23-33页
   ·面向对象设计第23-25页
   ·设计模式第25-30页
     ·Wrapper Facade模式第25-27页
     ·Scoped Locking模式第27-28页
     ·Command模式第28-30页
   ·FRONTIER和消息队列的设计第30-33页
三 高性能爬行器(Crawler)的实现第33-46页
   ·相关工作第33-34页
   ·性能瓶颈分析第34-38页
     ·网络通信延迟第36页
     ·礼貌(politeness)爬行问题第36-37页
     ·域名解析第37-38页
   ·机器人拒绝协议(Robot Exclusion Protocol)第38页
   ·Frontier-内存与磁盘驻留的数据结构第38-39页
   ·实现细节第39-46页
     ·HTTP协议的介绍第39-41页
     ·HTTP协议的封装第41-42页
     ·爬行控制器的结构图第42-43页
     ·爬行控制器的顶层类图第43-45页
     ·实验结果第45-46页
四 爬行策略控制器的实现第46-57页
   ·爬行策略控制器的工作流程第46-47页
   ·HTML解析器的实现第47-51页
   ·Na(?)ve Bayes网页分类器的实现第51-52页
   ·实现细节第52-57页
     ·文本处理第52页
     ·超链接的抽取第52-53页
     ·URL评价器的设计第53页
     ·数据的存储第53-55页
     ·爬行策略控制器的结构图第55页
     ·爬行策略控制器的顶层类图第55-57页
五 总结第57-59页
参考书目第59-61页
致谢第61页

论文共61页,点击 下载论文
上一篇:纳米钙补肾中药对肾虚骨质疏松大鼠肠钙吸收作用机制的研究
下一篇:55例重症肌无力临床研究