基于手机图片搜索引擎的设计与实现
摘要 | 第1-6页 |
Abstract | 第6-9页 |
第1章 引言 | 第9-15页 |
·研究背景 | 第9-10页 |
·研究现状 | 第10-11页 |
·现有图片检索系统简介 | 第11-13页 |
·本文主要研究内容及结构安排 | 第13-15页 |
第2章 相关技术 | 第15-31页 |
·网页抓取技术 | 第15-17页 |
·基本原理 | 第15页 |
·大型 SPider的问题 | 第15-17页 |
·算法解析 | 第17-22页 |
·PageRank算法 | 第17-20页 |
·HITS算法 | 第20-22页 |
·信息提取技术 | 第22-25页 |
·基于内容的提取技术 | 第22-24页 |
·基于文本的提取技术 | 第24-25页 |
·信息索引技术 | 第25-28页 |
·索引方式 | 第25-26页 |
·提高索引的性能 | 第26-28页 |
·其它相关技术 | 第28-29页 |
·数据存储 | 第28页 |
·中文分词 | 第28页 |
·签名技术 | 第28-29页 |
·小结 | 第29-31页 |
第3章 PageRank算法的研究及改进 | 第31-41页 |
·PageRank算法的优化 | 第31-35页 |
·内部链接 | 第31-33页 |
·入站链接 | 第33-35页 |
·出站链接 | 第35页 |
·算法效率研究 | 第35-38页 |
·查全率 | 第35-36页 |
·查准率 | 第36页 |
·相关性排序 | 第36-38页 |
·小结 | 第38-41页 |
第4章 Web上的图片信息提取 | 第41-61页 |
·HTML简介 | 第41-42页 |
·图片信息提取模式 | 第42-46页 |
·HTML信息提取方法 | 第46-50页 |
·HTML文档的规范化 | 第46-47页 |
·基于 DOM的提取方法 | 第47页 |
·基于字符串的提取方法 | 第47-48页 |
·基于Wrapper的提取方法 | 第48-50页 |
·无用图片过滤 | 第50-52页 |
·挖掘 HTML的潜在规律 | 第52-55页 |
·GIF和 JPG的区别 | 第52页 |
·和的不同意义 | 第52-53页 |
·图片引用次数的分析 | 第53-55页 |
·基于文本和基于内容的整合模式 | 第55-59页 |
·小结 | 第59-61页 |
第5章 手机图片搜索引擎的设计和实现 | 第61-77页 |
·系统简介 | 第61-63页 |
·系统详细工作流程 | 第63-74页 |
·获取网页 | 第63-64页 |
·提取信息 | 第64-65页 |
·图片抓取和死链检查 | 第65-66页 |
·生成缩略图 | 第66-67页 |
·建立索引 | 第67-71页 |
·提供查询 | 第71-74页 |
·系统测试 | 第74-75页 |
·小结 | 第75-77页 |
第6章 结论 | 第77-79页 |
·总结 | 第77页 |
·系统缺陷及展望 | 第77-79页 |
参考文献 | 第79-83页 |
致谢 | 第83页 |