基于Web图像搜索引擎的Spider系统设计与实现

摘要	第1-6页
ABSTRACT	第6-11页
第一章绪论	第11-19页
·研究背景和意义	第11-12页
·搜索引擎的历史及发展状况	第12-15页
·搜索引擎的分类	第13-14页
·搜索引擎的发展趋势	第14-15页
·图像搜索引擎的历史及发展状况	第15-16页
·网络爬虫的历史及发展状况	第16-17页
·本论文研究的主要内容	第17-18页
·本章小结	第18-19页
第二章相关技术介绍	第19-35页
·图像搜索引擎	第19-23页
·基于内容的图像检索	第23-25页
·基于颜色特征的提取技术	第24-25页
·基于纹理特征的提取技术	第25页
·基于形状特征的提取技术	第25页
·网络爬虫	第25-30页
·网络爬虫的工作原理	第25-27页
·网络爬虫的策略	第27-29页
·避免网页重复的策略	第29页
·网络爬虫的礼貌访问	第29-30页
·中文分词技术	第30-32页
·机械分词方法	第30-31页
·理解分词方法	第31-32页
·页面解析	第32页
·图像搜索引擎的性能评价标准	第32-34页
·本章小结	第34-35页
第三章系统整体设计	第35-41页
·系统结构设计	第35-36页
·数据下载模块	第36-37页
·预处理模块	第37-38页
·图像分类模块	第38-39页
·图像检索模块	第39页
·索引处理	第39-40页
·本章小结	第40-41页
第四章关键算法和系统实现	第41-71页
·Spider 系统	第41-47页
·爬虫初始化	第42-43页
·线程池	第43页
·链接生成器	第43-46页
·处理器链	第46-47页
·普通网站数据处理	第47-54页
·网页数据获取	第47-48页
·网页标记分析	第48-51页
·网页解析实现	第51-54页
·图像网站数据处理	第54-58页
·过滤器分析	第54-55页
·过滤器实现	第55-56页
·图像及其相关文字处理	第56-58页
·中文分词	第58-61页
·图像标准化	第61页
·爬虫更新策略	第61-68页
·网页结构	第63-64页
·网页内容	第64-66页
·网页图像	第66-67页
·算法分析	第67-68页
·爬虫优化策略	第68-70页
·本章小结	第70-71页
第五章系统测试	第71-79页
·测试环境	第71-72页
·爬虫和页面解析测试与分析	第72-74页
·系统测试与分析	第74-78页
·本章小结	第78-79页
第六章结束语	第79-81页
·总结	第79-80页
·展望	第80页
·本章小结	第80-81页
参考文献	第81-84页
致谢	第84-85页
攻硕期间取得的研究成果	第85-86页