基于视觉语言模型的蒙古文古籍图像检索技术研究

摘要	第4-6页
ABSTRACT	第6-7页
第一章绪论	第12-16页
1.1 课题研究的背景和意义	第12-13页
1.2 图像检索技术的研究和发展现状	第13-14页
1.3 本文主要工作	第14-15页
1.4 论文结构安排	第15-16页
第二章视觉词袋模型	第16-29页
2.1 视觉词袋模型介绍	第17-18页
2.2 视觉特征提取和描述	第18-21页
2.2.1 特征提取	第19页
2.2.2 特征描述	第19-21页
2.3 视觉词典的构建	第21-23页
2.4 图像表示与相似性度量	第23-24页
2.5 实验与分析	第24-28页
2.5.1 实验数据集	第24-25页
2.5.2 实验评价标准	第25页
2.5.3 实验结果分析	第25-28页
2.6 本章小结	第28-29页
第三章视觉语言模型	第29-37页
3.1 视觉语言模型介绍	第29-30页
3.2 平滑方法	第30-31页
3.3 查询似然模型	第31-32页
3.4 算法流程	第32-33页
3.4.1 单词图像表示	第32-33页
3.4.2 相似度计算	第33页
3.5 实验与分析	第33-36页
3.5.1 实验参数设置	第33页
3.5.2 平滑参数u的设置	第33-34页
3.5.3 视觉语言模型与视觉词袋模型的比较	第34-36页
3.6 本章小结	第36-37页
第四章空间视觉语言模型	第37-50页
4.1 空间金字塔介绍	第37-39页
4.2 空间金字塔的构建	第39-42页
4.2.1 特征提取和描述	第39页
4.2.2 构建视觉词典	第39-40页
4.2.3 基于蒙古文字形特点的空间划分	第40-41页
4.2.4 空间层级的权重分配	第41页
4.2.5 单词图像表示	第41页
4.2.6 相似性度量	第41-42页
4.3 空间视觉语言模型	第42-44页
4.3.1 多方法融合的意义	第42-43页
4.3.2 图像检索的构建	第43-44页
4.4 实验与分析	第44-49页
4.4.1 空间划分实验	第44-46页
4.4.2 空间视觉语言模型实验	第46-49页
4.5 本章小结	第49-50页
第五章总结与展望	第50-52页
5.1 研究工作总结	第50-51页
5.2 展望	第51-52页
致谢	第52-53页
参考文献	第53-57页
攻读硕士学位期间学术成果	第57页