基于手机图片搜索引擎的设计与实现

摘要	第1-6页
Abstract	第6-9页
第1章引言	第9-15页
·研究背景	第9-10页
·研究现状	第10-11页
·现有图片检索系统简介	第11-13页
·本文主要研究内容及结构安排	第13-15页
第2章相关技术	第15-31页
·网页抓取技术	第15-17页
·基本原理	第15页
·大型 SPider的问题	第15-17页
·算法解析	第17-22页
·PageRank算法	第17-20页
·HITS算法	第20-22页
·信息提取技术	第22-25页
·基于内容的提取技术	第22-24页
·基于文本的提取技术	第24-25页
·信息索引技术	第25-28页
·索引方式	第25-26页
·提高索引的性能	第26-28页
·其它相关技术	第28-29页
·数据存储	第28页
·中文分词	第28页
·签名技术	第28-29页
·小结	第29-31页
第3章 PageRank算法的研究及改进	第31-41页
·PageRank算法的优化	第31-35页
·内部链接	第31-33页
·入站链接	第33-35页
·出站链接	第35页
·算法效率研究	第35-38页
·查全率	第35-36页
·查准率	第36页
·相关性排序	第36-38页
·小结	第38-41页
第4章 Web上的图片信息提取	第41-61页
·HTML简介	第41-42页
·图片信息提取模式	第42-46页
·HTML信息提取方法	第46-50页
·HTML文档的规范化	第46-47页
·基于 DOM的提取方法	第47页
·基于字符串的提取方法	第47-48页
·基于Wrapper的提取方法	第48-50页
·无用图片过滤	第50-52页
·挖掘 HTML的潜在规律	第52-55页
·GIF和 JPG的区别	第52页
·和的不同意义	第52-53页
·图片引用次数的分析	第53-55页
·基于文本和基于内容的整合模式	第55-59页
·小结	第59-61页
第5章手机图片搜索引擎的设计和实现	第61-77页
·系统简介	第61-63页
·系统详细工作流程	第63-74页
·获取网页	第63-64页
·提取信息	第64-65页
·图片抓取和死链检查	第65-66页
·生成缩略图	第66-67页
·建立索引	第67-71页
·提供查询	第71-74页
·系统测试	第74-75页
·小结	第75-77页
第6章结论	第77-79页
·总结	第77页
·系统缺陷及展望	第77-79页
参考文献	第79-83页
致谢	第83页