摘要 | 第1-6页 |
ABSTRACT | 第6-9页 |
第1章 绪论 | 第9-14页 |
·研究背景及选题意义 | 第9页 |
·Web服务搜索与发现研究现状 | 第9-12页 |
·研究内容及论文框架 | 第12-14页 |
第2章 相关理论及技术 | 第14-20页 |
·Web服务概述 | 第14-16页 |
·Web服务的体系结构 | 第14-15页 |
·Web服务标准描述语言(WSDL) | 第15-16页 |
·搜索引擎 | 第16-18页 |
·搜索引擎基础 | 第16-17页 |
·基于网络爬虫的搜索引擎概述 | 第17-18页 |
·基于HTML网页的信息提取 | 第18-20页 |
第3章 基于Crawler的Web服务搜索模型的研究与设计 | 第20-50页 |
·模型框架 | 第20-23页 |
·模型设计 | 第20-22页 |
·流程分析 | 第22-23页 |
·网络爬虫关键问题的分析与设计 | 第23-49页 |
·爬虫爬行策略设计 | 第23-28页 |
·DNS缓存设计 | 第28-34页 |
·Robot协议与蜘蛛陷阱分析 | 第34-36页 |
·URL消重策略设计 | 第36-41页 |
·信息库更新策略设计 | 第41-49页 |
·WSDL文档的筛选 | 第49-50页 |
第4章 Web服务的二次检索与匹配的设计 | 第50-60页 |
·基于WordNet语义网的Web服务聚类 | 第50-57页 |
·WordNet语义网 | 第50-51页 |
·词语相似度的计算 | 第51-54页 |
·基于相似度构造特征词集合的最小生成树 | 第54-55页 |
·Web服务聚类 | 第55-57页 |
·Web服务二次检索与匹配的设计 | 第57-60页 |
·Web服务二次检索与匹配的策略设计 | 第57-58页 |
·Web服务二次检索的流程 | 第58-60页 |
第5章 基于Crawler的Web服务搜索模型的实现与评价 | 第60-77页 |
·开发环境 | 第60-61页 |
·数据库设计 | 第61-63页 |
·基于多线程的网络爬虫的设计与实现 | 第63-75页 |
·网络爬虫Crawler及多线程的设计与实现 | 第63-68页 |
·网页抓取模块 | 第68-72页 |
·网页解析模块 | 第72页 |
·URL消重模块 | 第72-74页 |
·WSDL解析模块 | 第74-75页 |
·模型评价 | 第75-77页 |
第6章 总结与展望 | 第77-79页 |
参考文献 | 第79-84页 |
攻读学位期间公开发表论文 | 第84-85页 |
致谢 | 第85页 |