摘要 | 第1-5页 |
Abstract | 第5-12页 |
第1章 引言 | 第12-23页 |
·说话人识别研究现状 | 第12-14页 |
·传统说话人识别的难题 | 第14-15页 |
·说话人之间的变化 | 第14页 |
·周围环境的变化 | 第14-15页 |
·手机说话人识别系统的难点 | 第15-16页 |
·NIST SRE评测 | 第16-18页 |
·移动互联背景下的手机发展 | 第18-19页 |
·现有移动平台上的语音应用 | 第19-21页 |
·研究意义 | 第21-22页 |
·本文安排 | 第22-23页 |
第2章 基于混合高斯-因子分析模型的说话人识别系统 | 第23-47页 |
·NIST SRE 2010评测介绍 | 第23-25页 |
·决策错误代价DET和等错误率EER | 第25页 |
·检测代价函数 | 第25页 |
·基于混合高斯模型的说话人识别系统 | 第25-37页 |
·梅尔倒谱系数特征提取 | 第26-28页 |
·线性预测倒谱系数 | 第28页 |
·前端特征处理 | 第28-29页 |
·全局背景模型的训练 | 第29-30页 |
·目标说话人模型的训练 | 第30-31页 |
·EM算法的参数估计以及训练 | 第31-34页 |
·测试 | 第34-35页 |
·得分规整 | 第35-37页 |
·因子分析识别子系统 | 第37-44页 |
·因子分析介绍 | 第37页 |
·说话人识别的因子分析方法 | 第37-41页 |
·Eigen-Channel模型训练 | 第41-43页 |
·因子分析测试计算过程 | 第43-44页 |
·Focal线性融合实验 | 第44-45页 |
·本章小节 | 第45-47页 |
第3章 面向OPHONE平台上的移植参数选择实验 | 第47-61页 |
·ARM平台和PC平台区别 | 第47-49页 |
·ARM和X86的区别 | 第48页 |
·ARM指令集和X86指令集的比较 | 第48-49页 |
·特征选择评估实验 | 第49-55页 |
·快速傅里叶变换长度选择实验 | 第49-54页 |
·特征维度选择 | 第54-55页 |
·模型训练评估实验 | 第55-60页 |
·高斯阶数实验 | 第56-58页 |
·训练模型迭代次数 | 第58页 |
·移动平台说话人识别参数 | 第58-60页 |
·本章小结 | 第60-61页 |
第4章 移动平台说话人识别系统架构及实现 | 第61-74页 |
·OPHONE手机介绍 | 第61-63页 |
·ARM编译环境 | 第61-63页 |
·系统后台设计 | 第63-66页 |
·动态链接库JAVA调用 | 第63-65页 |
·静态编译后端ADB运行 | 第65-66页 |
·系统前端设计 | 第66-69页 |
·前台锁管理界面设计 | 第67-68页 |
·前台录音模块 | 第68-69页 |
·前端锁原理设计 | 第69-71页 |
·前后端通讯方法 | 第71-73页 |
·本章小结 | 第73-74页 |
第5章 移动平台下说话人识别确认策略 | 第74-81页 |
·OPHONE手机通道下的冒领者语料库 | 第74-75页 |
·录音语句 | 第74-75页 |
·浮动阀值设置 | 第75-77页 |
·浮动阀值的上限 | 第75-76页 |
·浮动阀值下限 | 第76页 |
·浮动阀值系数设定 | 第76-77页 |
·时间漂移下的说话人模型确定 | 第77-78页 |
·话筒位置影响下的阀值设定 | 第78-79页 |
·本章小结 | 第79-81页 |
第6章 总结与展望 | 第81-84页 |
·总结 | 第81-82页 |
·展望 | 第82-84页 |
参考文献 | 第84-89页 |
攻读硕士学位期间主要的研究成果 | 第89-90页 |
致谢 | 第90页 |