首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--电声技术与设备论文

面向音频检索的音频特征分析方法研究

摘要第5-7页
Abstract第7-8页
主要缩写对照表第14-16页
第一章 绪论第16-25页
    1.1 音频检索的研究意义第16-18页
    1.2 音频检索的研究现状第18-23页
        1.2.1 音频特征提取和音效分类的发展现状第18-21页
        1.2.2 多媒体检索发展现状第21-23页
    1.3 论文的主要工作及章节安排第23-25页
第二章 基于谐波分量的音频特征第25-46页
    2.1 音频的频域特征第25-28页
    2.2 谐波字典第28-32页
        2.2.1 人脑对谐波信号的感知第28-30页
        2.2.2 谐波字典第30-32页
    2.3 基于匹配追踪的频谱分解第32-39页
        2.3.1 稀疏表示的基本概念第32-33页
        2.3.2 稀疏表示的求解算法第33-36页
        2.3.3 频谱分解第36-38页
        2.3.4 音频特征的表示第38-39页
    2.4 实验与结果分析第39-45页
        2.4.1 数据库和实验平台第39-41页
        2.4.2 实验及结果分析第41-45页
    2.5 本章小结第45-46页
第三章 基于感知子空间的时-频特征提取第46-65页
    3.1 基于心理声学的感知子空间划分第46-50页
        3.1.1 人脑对瞬变信号的感知第46-49页
        3.1.2 基于感知子空间的分解模型第49-50页
    3.2 感知子空间的数学描述第50-54页
        3.2.1 谐波子空间的数学定义第50-52页
        3.2.2 瞬时子空间的数学定义第52-53页
        3.2.3 残差子空间的数学定义第53-54页
    3.3 音频信号的分解第54-57页
        3.3.1 基于匹配追踪的音频信号分解第54-56页
        3.3.2 音频特征的表示第56-57页
    3.4 实验与结果分析第57-64页
        3.4.1 实验设置第57-58页
        3.4.2 子空间分解实例第58-59页
        3.4.3 子空间分类效果第59-61页
        3.4.4 与其他特征比较结果第61-64页
    3.5 本章小结第64-65页
第四章 基于系数张量的时-频特征提取第65-100页
    4.1 张量的概念及其基本运算第65-71页
        4.1.1 张量的定义第65-67页
        4.1.2 张量的展开第67-68页
        4.1.3 张量的运算第68-71页
        4.1.4 张量的秩第71页
    4.2 张量分解模型第71-82页
        4.2.1 非负稀疏矩阵分解第71-76页
        4.2.2 PARAFAC模型第76-79页
        4.2.3 Tucker模型第79-82页
    4.3 基于系数张量的音频特征提取第82-88页
        4.3.1 系数张量第83-85页
        4.3.2 非负稀疏张量分解第85-88页
    4.4 计算复杂度分析第88-89页
    4.5 实验与结果分析第89-98页
        4.5.1 系数张量实例第89-91页
        4.5.2 张量分解第91-93页
        4.5.3 闭集测试结果第93-97页
        4.5.4 开集测试结果第97-98页
    4.6 本章小结第98-100页
第五章 基于倒排索引的音频检索第100-127页
    5.1 基于不相邻数据窗的说话人分割第100-106页
        5.1.1 说话人改变检测第100-102页
        5.1.2 相邻数据窗的方法对噪音的敏感性第102-103页
        5.1.3 不相邻数据窗第103-106页
    5.2 基于多层结构的音频分割算法第106-109页
        5.2.1 基于能量的分割第107页
        5.2.2 基于内容的分割第107-108页
        5.2.3 基于一阶、二阶统计量的分割第108-109页
    5.3 基于倒排索引的音频内容检索第109-118页
        5.3.1 检索算法第109-110页
        5.3.2 半监督的音频字典和音频字量化第110-113页
        5.3.3 倒排索引的建立第113-116页
        5.3.4 基于倒排索引的检索第116-118页
    5.4 实验与结果分析第118-126页
        5.4.1 基于不相邻窗的说话人改变检测第118-120页
        5.4.2 内容检索数据库及实验设置第120-122页
        5.4.3 查询样本时长和返回结果个数对查询结果的影响第122页
        5.4.4 与其他检索算法的比较结果第122-126页
    5.5 本章小结第126-127页
第六章 总结与展望第127-130页
    研究总结第127-128页
    后续工作展望第128-130页
参考文献第130-140页
攻读博士学位期间取得的研究成果第140-142页
致谢第142-144页
附件第144页

论文共144页,点击 下载论文
上一篇:新型UHF近场天线研究
下一篇:我国“灰色青年”社会关系网络研究--基于河南T县调查的分析