基于木棉教育新闻平台的图片检索子系统设计与实现

摘要	第5-6页
Abstract	第6页
目录	第7-10页
第一章绪论	第10-18页
1.1 研究背景与意义	第10-11页
1.2 国内外研究现状	第11-16页
1.2.1 图片检索研究现状	第11-12页
1.2.2 WEB 信息抽取研究现状	第12-13页
1.2.3 新闻图片排序研究现状	第13-16页
1.3 论文工作目的与内容	第16-17页
1.4 论文组织结构	第17-18页
第二章相关技术与背景知识	第18-32页
2.1 基于文本的图片检索系统	第18-19页
2.2 网页信息抽取	第19-24页
2.2.1 文档对象模型 DOM	第19页
2.2.2 网页分块	第19-21页
2.2.3 KapokImageExtractor	第21-24页
2.3 Lucene 信息检索工具包	第24-28页
2.3.1 Lucene 的架构	第24-25页
2.3.2 Lucene 的索引结构	第25-27页
2.3.3 Lucene 的评分公式	第27-28页
2.4 木棉教育新闻平台	第28-31页
2.5 本章小结	第31-32页
第三章系统总体设计	第32-36页
3.1 设计原则	第32页
3.2 系统框架设计	第32-33页
3.3 系统模块介绍	第33-35页
3.3.1 图片信息抽取模块	第33-34页
3.3.2 图片采集及处理模块	第34页
3.3.3 图片索引与检索模块	第34-35页
3.4 与木棉新闻平台的交互	第35页
3.5 本章小结	第35-36页
第四章图片信息抽取	第36-53页
4.1 相关问题描述	第36-41页
4.1.1 新闻网页结构分析	第36-38页
4.1.2 图片描述文本	第38-41页
4.2 设计思路	第41页
4.3 网页预处理	第41-42页
4.4 网页分块	第42-44页
4.5 图片及其描述文本抽取	第44-51页
4.5.1 总抽取流程	第45-46页
4.5.2 获取候选主题块集合	第46-47页
4.5.3 获取主题块	第47页
4.5.4 网页块中抽取图片及其描述文本	第47-50页
4.5.5 合并相邻网页块	第50-51页
4.6 本章小结	第51-53页
第五章图片采集及处理	第53-60页
5.1 图片采集	第53-56页
5.1.1 系统初始化	第54页
5.1.2 URL 调度	第54-55页
5.1.3 图片下载	第55-56页
5.1.4 图片过滤	第56页
5.2 缩略图制作	第56页
5.3 图片存储	第56-59页
5.3.1 图片存储子系统设计	第57-59页
5.3.2 存储子系统分析	第59页
5.4 本章小结	第59-60页
第六章图片索引与检索	第60-67页
6.1 索引创建	第60-61页
6.2 文本索引	第61-62页
6.3 检索	第62-66页
6.3.1 新闻图片排序	第63-66页
6.4 本章小结	第66-67页
第七章系统实现与实验结果分析	第67-91页
7.1 系统实现	第67-77页
7.1.1 系统的实现流程	第67-70页
7.1.2 基于文本的新闻图片检索子系统实现	第70-74页
7.1.3 木棉教育新闻平台图片展示功能实现	第74-77页
7.2 实验结果与分析	第77-89页
7.2.1 实验环境	第77-78页
7.2.2 图片信息抽取实验	第78-84页
7.2.3 新闻图片检索实验	第84-89页
7.3 本章小结	第89-91页
结论和展望	第91-93页
参考文献	第93-97页
攻读硕士学位期间取得的研究成果	第97-98页
致谢	第98-99页
附件	第99页