中文摘要 | 第1-5页 |
英文摘要 | 第5-8页 |
第一章 绪论 | 第8-13页 |
1.1 WWW技术及特点 | 第8-9页 |
1.2 Web搜索引擎的研究现状 | 第9-12页 |
1.2.1 全球七大导航台 | 第9页 |
1.2.2 中文搜索引擎简介 | 第9-11页 |
1.2.3 中文搜索引擎的地位和研究现状 | 第11-12页 |
1.3 论文选题与应用意义 | 第12-13页 |
1.3.1 论文选题 | 第12页 |
1.3.2 应用意义 | 第12-13页 |
第二章 Web搜索引擎的特点及评价标准 | 第13-17页 |
2.1 Web搜索引擎的类型及概念 | 第13-15页 |
2.1.1 URL(统一资源定位符) | 第13页 |
2.1.2 HTTP(超文本传输协议) | 第13-14页 |
2.1.3 HTML(超文本标记语言) | 第14页 |
2.1.4 搜索引擎的基本类型 | 第14-15页 |
2.2 优秀搜索引擎应具有的特点 | 第15-16页 |
2.3 搜索引擎的评价标准 | 第16-17页 |
第三章 Web搜索引擎的工作原理 | 第17-21页 |
3.1 网页搜索工具(Spider) | 第17-18页 |
3.2 网页数据库 | 第18-19页 |
3.3 搜索引擎的工作界面 | 第19-21页 |
第四章 “首信”搜索引擎的制作过程 | 第21-30页 |
4.1 预定的指标 | 第21页 |
4.2 设计原则 | 第21-22页 |
4.3 选用开发工具和平台 | 第22-24页 |
4.3.1 环境需求 | 第22页 |
4.3.2 选择平台时的考虑 | 第22-24页 |
4.4 系统的主要模块结构 | 第24-30页 |
第五章 分布式并行Spider系统的设计 | 第30-36页 |
5.1 Spider系统并行原理 | 第30-31页 |
5.2 Spider系统体系结构 | 第31-33页 |
5.3 Spider系统构成和功能描述 | 第33-36页 |
5.3.1 任务管理器(Task Manager) | 第32-33页 |
5.3.2 信息收集代理(Gather Agent) | 第33页 |
5.3.3 TM与GA的通信原语 | 第33-35页 |
5.3.4 TM与GA的通信流图 | 第35-36页 |
第六章 用VC++实现Spider系统 | 第36-57页 |
6.1 服务器端程序TaskSrvr | 第36-40页 |
6.1.1 TaskSrvr的工作流程 | 第36页 |
6.1.2 TaskSrvr自定义消息类型 | 第36-37页 |
6.1.3 TaskSrv主要模块说明 | 第37-38页 |
6.1.4 TaskSrvr的用户界面及使用 | 第38-40页 |
6.2 客户端程序Spider | 第40-45页 |
6.2.1 Spider的工作流程 | 第40-41页 |
6.2.2 Spider自定义消息类型 | 第41页 |
6.2.3 Spider主要模块说明 | 第41-43页 |
6.2.4 Spider的用户界面及使用 | 第43-45页 |
6.2.5 Spider性能评价 | 第45页 |
6.3 ODBC实现数据库编程 | 第45-57页 |
6.3.1 ODBC简介 | 第45-46页 |
6.3.2 MFC提供的ODBC数据库类 | 第46-47页 |
6.3.3 数据源配置 | 第47-49页 |
6.3.4 在MFC应用程序中加进ODBC机制 | 第49页 |
6.3.5 ODBC编程 | 第49-57页 |
第七章 多线程技术在Spider系统的应用 | 第57-62页 |
7.1 多任务,多进程和多线程 | 第57页 |
7.2 基于MFC的多线程编程 | 第57-60页 |
7.2.1 辅助线程和用户界面线程 | 第57页 |
7.2.2 线程的创建和终止 | 第57-58页 |
7.2.3 多线程Spider编程 | 第58-60页 |
7.2.4 同步对象的使用 | 第60页 |
7.3 设计多线程的考虑 | 第60-62页 |
第八章 结束语 | 第62-65页 |
致谢 | 第65-66页 |
参考文献 | 第66页 |