中文互联网视频搜索引擎系统策略研究
致谢 | 第1-6页 |
中文摘要 | 第6-8页 |
ABSTRACT | 第8-10页 |
序 | 第10-18页 |
1 绪论 | 第18-30页 |
·引言 | 第18-19页 |
·视频搜索引擎要解决的新问题 | 第19-23页 |
·更全面的数据收录和更快的数据更新 | 第20-21页 |
·更加精准的网页内容提取技术 | 第21-22页 |
·更加优化的检索排序算法 | 第22-23页 |
·过去的视频搜索研究成果不能应用于互联网环境 | 第23-26页 |
·基于文件的视频搜索不适用于现代互联网特性 | 第23-24页 |
·基于内容的视频搜索的精准性和性能不足 | 第24-25页 |
·基于文本信息的视频搜索将成为主流技术方向 | 第25-26页 |
·本论文的主要工作和组织结构 | 第26-28页 |
·关于本论文算法对比与性能分析的说明 | 第28-30页 |
2 视频搜索引擎核心技术问题的提出 | 第30-62页 |
·引言 | 第30页 |
·搜索引擎的架构、原理及评估 | 第30-41页 |
·数据抓取子系统 | 第31-34页 |
·数据索引子系统 | 第34-35页 |
·超链分析子系统 | 第35-36页 |
·内容检索子系统 | 第36-38页 |
·搜索引擎的评估标准 | 第38-40页 |
·视频搜索的系统架构模型 | 第40-41页 |
·中文互联网视频数据分布的研究 | 第41-55页 |
·网页视频网站的视频数量测量 | 第43-45页 |
·视频分享网站的视频数量测量 | 第45-49页 |
·基于搜索的覆盖率估计算法 | 第49-54页 |
·视频数据分布研究工作小结 | 第54-55页 |
·视频搜索用户行为的研究 | 第55-60页 |
·用户对视频内容的搜索请求高速增长 | 第55-56页 |
·视频类查询词的特点研究 | 第56-57页 |
·视频类查询的用户点击行为分析 | 第57-60页 |
·用户行为研究小结 | 第60页 |
·视频搜索引擎的核心技术问题 | 第60-61页 |
·本章小结 | 第61-62页 |
3 面向视频分享网站的定向抓取算法 | 第62-78页 |
·引言 | 第62-63页 |
·基本概念与研究现状 | 第63-64页 |
·基于视频网站结构的视频网页类型识别算法 | 第64-73页 |
·算法的基本思路 | 第64-67页 |
·网页类型识别PTI算法 | 第67-70页 |
·增量式的网页类型识别IPTI算法 | 第70-73页 |
·结构化信息抽取的算法 | 第73-76页 |
·包装器归纳算法 | 第73-74页 |
·抽取规则学习算法 | 第74-75页 |
·包装器的应用与维护 | 第75-76页 |
·定向抓取算法性能评估 | 第76-77页 |
·覆盖率评估 | 第76页 |
·时效性评估 | 第76-77页 |
·本章小结 | 第77-78页 |
4 面向网页视频的挖掘和信息抽取算法 | 第78-108页 |
·引言 | 第78-79页 |
·面向全网spider系统的URL抓取优先级算法 | 第79-100页 |
·Spider的评估标准 | 第80-81页 |
·研究现状 | 第81-82页 |
·URL抓取问题和图搜索问题的描述 | 第82页 |
·图搜索中常用算法 | 第82-84页 |
·基于推荐的图搜索算法 | 第84-88页 |
·基于模型的图搜索算法 | 第88-95页 |
·基于度失配的图搜索算法 | 第95-100页 |
·网页库中视频播放页面的识别策略 | 第100-102页 |
·网页视频播放页面的信息抽取算法 | 第102-104页 |
·DOM树建模 | 第103-104页 |
·DOM树搜索算法 | 第104页 |
·网页视频播放页面识别与抽取算法的评估 | 第104-106页 |
·页面识别的召回率 | 第105页 |
·信息抽取的准确性 | 第105-106页 |
·本章小结 | 第106-108页 |
5 面向视频搜索的检索排序算法 | 第108-128页 |
·引言 | 第108页 |
·权值计算的基本模型 | 第108-110页 |
·文本相关性的计算 | 第110-112页 |
·视频质量的度量 | 第112-115页 |
·归并排序算法 | 第115-127页 |
·归并排序算法概述 | 第116-118页 |
·视频搜索的归并排序 | 第118-121页 |
·归并排序算法的实验 | 第121-127页 |
·本章小结 | 第127-128页 |
6 视频搜索引擎性能评估 | 第128-146页 |
·引言 | 第128页 |
·数据获取性能评估 | 第128-134页 |
·定向抓取的性能评估 | 第128-132页 |
·网页视频挖掘的性能评估 | 第132-134页 |
·搜索性能评估 | 第134-139页 |
·检索相关性评估 | 第134-136页 |
·搜索访问量评估 | 第136-137页 |
·视频搜索用户数量评估 | 第137-138页 |
·对国内互联网视频行业的贡献 | 第138-139页 |
·与其它视频搜索引擎网站的对比 | 第139-144页 |
·“谷歌”视频搜索引擎 | 第139-140页 |
·Bing“必应”视频搜索 | 第140-141页 |
·视频搜索引擎的对比 | 第141-144页 |
·本章小结 | 第144-146页 |
7 总结及展望 | 第146-150页 |
·全文内容总结 | 第146-147页 |
·未来工作及展望 | 第147-150页 |
参考文献 | 第150-158页 |
附录 A | 第158-160页 |
作者简历 | 第160-164页 |
学位论文数据集 | 第164页 |