基于Crawler的Web服务搜索研究

摘要	第1-6页
ABSTRACT	第6-9页
第1章绪论	第9-14页
·研究背景及选题意义	第9页
·Web服务搜索与发现研究现状	第9-12页
·研究内容及论文框架	第12-14页
第2章相关理论及技术	第14-20页
·Web服务概述	第14-16页
·Web服务的体系结构	第14-15页
·Web服务标准描述语言(WSDL)	第15-16页
·搜索引擎	第16-18页
·搜索引擎基础	第16-17页
·基于网络爬虫的搜索引擎概述	第17-18页
·基于HTML网页的信息提取	第18-20页
第3章基于Crawler的Web服务搜索模型的研究与设计	第20-50页
·模型框架	第20-23页
·模型设计	第20-22页
·流程分析	第22-23页
·网络爬虫关键问题的分析与设计	第23-49页
·爬虫爬行策略设计	第23-28页
·DNS缓存设计	第28-34页
·Robot协议与蜘蛛陷阱分析	第34-36页
·URL消重策略设计	第36-41页
·信息库更新策略设计	第41-49页
·WSDL文档的筛选	第49-50页
第4章 Web服务的二次检索与匹配的设计	第50-60页
·基于WordNet语义网的Web服务聚类	第50-57页
·WordNet语义网	第50-51页
·词语相似度的计算	第51-54页
·基于相似度构造特征词集合的最小生成树	第54-55页
·Web服务聚类	第55-57页
·Web服务二次检索与匹配的设计	第57-60页
·Web服务二次检索与匹配的策略设计	第57-58页
·Web服务二次检索的流程	第58-60页
第5章基于Crawler的Web服务搜索模型的实现与评价	第60-77页
·开发环境	第60-61页
·数据库设计	第61-63页
·基于多线程的网络爬虫的设计与实现	第63-75页
·网络爬虫Crawler及多线程的设计与实现	第63-68页
·网页抓取模块	第68-72页
·网页解析模块	第72页
·URL消重模块	第72-74页
·WSDL解析模块	第74-75页
·模型评价	第75-77页
第6章总结与展望	第77-79页
参考文献	第79-84页
攻读学位期间公开发表论文	第84-85页
致谢	第85页