基于手机图片搜索引擎的设计与实现
| 摘要 | 第1-6页 |
| Abstract | 第6-9页 |
| 第1章 引言 | 第9-15页 |
| ·研究背景 | 第9-10页 |
| ·研究现状 | 第10-11页 |
| ·现有图片检索系统简介 | 第11-13页 |
| ·本文主要研究内容及结构安排 | 第13-15页 |
| 第2章 相关技术 | 第15-31页 |
| ·网页抓取技术 | 第15-17页 |
| ·基本原理 | 第15页 |
| ·大型 SPider的问题 | 第15-17页 |
| ·算法解析 | 第17-22页 |
| ·PageRank算法 | 第17-20页 |
| ·HITS算法 | 第20-22页 |
| ·信息提取技术 | 第22-25页 |
| ·基于内容的提取技术 | 第22-24页 |
| ·基于文本的提取技术 | 第24-25页 |
| ·信息索引技术 | 第25-28页 |
| ·索引方式 | 第25-26页 |
| ·提高索引的性能 | 第26-28页 |
| ·其它相关技术 | 第28-29页 |
| ·数据存储 | 第28页 |
| ·中文分词 | 第28页 |
| ·签名技术 | 第28-29页 |
| ·小结 | 第29-31页 |
| 第3章 PageRank算法的研究及改进 | 第31-41页 |
| ·PageRank算法的优化 | 第31-35页 |
| ·内部链接 | 第31-33页 |
| ·入站链接 | 第33-35页 |
| ·出站链接 | 第35页 |
| ·算法效率研究 | 第35-38页 |
| ·查全率 | 第35-36页 |
| ·查准率 | 第36页 |
| ·相关性排序 | 第36-38页 |
| ·小结 | 第38-41页 |
| 第4章 Web上的图片信息提取 | 第41-61页 |
| ·HTML简介 | 第41-42页 |
| ·图片信息提取模式 | 第42-46页 |
| ·HTML信息提取方法 | 第46-50页 |
| ·HTML文档的规范化 | 第46-47页 |
| ·基于 DOM的提取方法 | 第47页 |
| ·基于字符串的提取方法 | 第47-48页 |
| ·基于Wrapper的提取方法 | 第48-50页 |
| ·无用图片过滤 | 第50-52页 |
| ·挖掘 HTML的潜在规律 | 第52-55页 |
| ·GIF和 JPG的区别 | 第52页 |
| ·和的不同意义 | 第52-53页 |
| ·图片引用次数的分析 | 第53-55页 |
| ·基于文本和基于内容的整合模式 | 第55-59页 |
| ·小结 | 第59-61页 |
| 第5章 手机图片搜索引擎的设计和实现 | 第61-77页 |
| ·系统简介 | 第61-63页 |
| ·系统详细工作流程 | 第63-74页 |
| ·获取网页 | 第63-64页 |
| ·提取信息 | 第64-65页 |
| ·图片抓取和死链检查 | 第65-66页 |
| ·生成缩略图 | 第66-67页 |
| ·建立索引 | 第67-71页 |
| ·提供查询 | 第71-74页 |
| ·系统测试 | 第74-75页 |
| ·小结 | 第75-77页 |
| 第6章 结论 | 第77-79页 |
| ·总结 | 第77页 |
| ·系统缺陷及展望 | 第77-79页 |
| 参考文献 | 第79-83页 |
| 致谢 | 第83页 |