致谢 | 第4-7页 |
摘要 | 第7-8页 |
1.文献综述 | 第8-14页 |
1.1 视频检索的研究现状 | 第8-9页 |
1.1.1 视频文件检索的研究现状 | 第8页 |
1.1.2 视频内容检索研究现状 | 第8-9页 |
1.2 全文检索技术的国内外发展现状 | 第9-10页 |
1.2.1 国外研究现状 | 第9-10页 |
1.2.2 国内研究现状 | 第10页 |
1.3 分布式计算技术 | 第10-14页 |
1.3.1 基于计算切分的分布式计算技术 | 第11-12页 |
1.3.2 基于计算和数据切分的混合型分布式计算技术 | 第12页 |
1.3.3 基于数据切分的分布式计算技术 | 第12-14页 |
2.引言 | 第14-16页 |
3. 基于分布式计算的音视频索引方法设计 | 第16-21页 |
3.1 系统体系结构 | 第16页 |
3.2 系统方法设计流程 | 第16-17页 |
3.3 数据的存储设计 | 第17-19页 |
3.3.1 视频源文件的存储 | 第17-18页 |
3.3.2 视频内容文本文件存储 | 第18-19页 |
3.3.3 索引文件的解析存储 | 第19页 |
3.4 系统的拓扑结构 | 第19-20页 |
3.5 小结 | 第20-21页 |
4. 基于语音识别的数据预处理 | 第21-28页 |
4.1 视频文本内容的提取 | 第21-25页 |
4.1.1 基于FFmpeg的音视频流分离 | 第21-23页 |
4.1.1.1FFmpeg技术 | 第21-22页 |
4.1.1.2 音视频流分离模型 | 第22页 |
4.1.1.3 音视频流分离流程 | 第22-23页 |
4.1.2 语音识别 | 第23-25页 |
4.2 实验与分析 | 第25-27页 |
4.3 小结 | 第27-28页 |
5. 倒排索引的并行构建 | 第28-35页 |
5.1 中文分词 | 第28-29页 |
5.1.1 中文分词算法 | 第28页 |
5.1.2 词典结构 | 第28-29页 |
5.2 索引词的Rank值 | 第29-30页 |
5.3 并行构建索引表 | 第30-33页 |
5.3.1 倒排表存储格式 | 第30-31页 |
5.3.2 基于MapReduce编程模型构建倒排索引表的实现 | 第31-32页 |
5.3.3 MapReduce性能优化 | 第32-33页 |
5.4 实验与分析 | 第33-34页 |
5.5 小结 | 第34-35页 |
6. 系统运行环境与原型系统的实现 | 第35-42页 |
6.1 实验环境搭建 | 第35-36页 |
6.1.1 开发环境与软件包 | 第35页 |
6.1.2 集群拓扑结构 | 第35-36页 |
6.2 原型系统的设计与实现 | 第36-41页 |
6.2.1 分布式索引子系统的设计与实现 | 第36-39页 |
6.2.1.1 分布式存储接口设计 | 第36-37页 |
6.2.1.2 分布式索引计算设计 | 第37-38页 |
6.2.1.3 索引解析设计 | 第38-39页 |
6.2.2 检索服务子系统的设计实现 | 第39-41页 |
6.3 小结 | 第41-42页 |
7. 结论和展望 | 第42-43页 |
参考文献 | 第43-46页 |
ABSTRACT | 第46-47页 |