首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于深度学习的自然场景文字检测与识别方法研究

摘要第4-6页
Abstract第6-7页
第一章 绪论第16-34页
    1.1 选题背景第16-20页
    1.2 研究内容和意义第20-22页
    1.3 研究现状第22-31页
        1.3.1 场景文字检测第22-25页
        1.3.2 场景文字识别第25-27页
        1.3.3 语种识别第27-28页
        1.3.4 相关数据集第28-29页
        1.3.5 业界产品第29-31页
        1.3.6 研究现状总结第31页
    1.4 主要贡献第31-32页
    1.5 结构安排第32-34页
第二章 场景文字检测第34-53页
    2.1 引言第34-36页
    2.2 相关工作第36-37页
        2.2.1 场景文字检测第36-37页
        2.2.2 物体检测第37页
    2.3 片段链接第37-43页
        2.3.1 网络模型第37-38页
        2.3.2 片段检测第38-39页
        2.3.3 同层链接检测第39-41页
        2.3.4 跨层链接检测第41页
        2.3.5 卷积预测器输出第41-42页
        2.3.6 片段组合第42-43页
    2.4 模型训练第43-45页
        2.4.1 标签生成第43-44页
        2.4.2 模型优化第44-45页
    2.5 实验验证第45-51页
        2.5.1 数据集第45-46页
        2.5.2 实现细节第46页
        2.5.3 任意方向文字检测第46-47页
        2.5.4 多语言长文字检测第47-49页
        2.5.5 水平文字检测第49-50页
        2.5.6 方法局限性第50-51页
    2.6 本章小结第51-53页
第三章 场景文字识别第53-73页
    3.1 引言第53-54页
    3.2 卷积循环神经网络第54-63页
        3.2.1 卷积神经网络第55-56页
        3.2.2 循环神经网络第56-59页
        3.2.3 翻译层第59-62页
        3.2.4 网络训练第62-63页
    3.3 实验验证第63-67页
        3.3.1 数据集第63页
        3.3.2 实现细节第63-65页
        3.3.3 性能比较和评估第65-66页
        3.3.4 超参数影响第66-67页
    3.4 拓展应用:乐谱识别第67-70页
    3.5 本章小结第70-71页
    附表第71-73页
第四章 不规则场景文字识别第73-100页
    4.1 引言第73-74页
    4.2 相关工作第74-75页
        4.2.1 场景文字识别第74页
        4.2.2 不规则场景文字识别第74-75页
    4.3 网络模型第75-85页
        4.3.1 矫正网络第75-80页
        4.3.2 识别网络第80-84页
        4.3.3 模型训练第84-85页
    4.4 实验验证第85-94页
        4.4.1 实验设置第85-88页
        4.4.2 矫正网络实验第88-91页
        4.4.3 识别网络实验第91-93页
        4.4.4 方法比较第93-94页
    4.5 端到端识别第94-96页
    4.6 本章小结第96-98页
    附表第98-100页
第五章 场景文字语种识别第100-120页
    5.1 引言第100-102页
    5.2 区分式卷积神经网络第102-108页
        5.2.1 方法总览第102-103页
        5.2.2 深度卷积特征提取第103-104页
        5.2.3 区分性图块发现第104-106页
        5.2.4 中层表示和分类第106-107页
        5.2.5 端到端微调第107-108页
    5.3 SIW-13数据集第108-109页
    5.4 实验验证第109-118页
        5.4.1 实现细节第110-111页
        5.4.2 参与比较的方法第111-113页
        5.4.3 场景文字语种识别第113-114页
        5.4.4 视频文字语种识别第114-115页
        5.4.5 文档文字语种识别第115-116页
        5.4.6 参数讨论第116-117页
        5.4.7 方法局限性第117-118页
    5.5 本章小结第118-119页
    附图第119-120页
第六章 总结与展望第120-122页
    6.1 全文总结第120-121页
    6.2 研究展望第121-122页
尾注第122-123页
致谢第123-124页
参考文献第124-134页
附录A 攻读学位期间的主要学术成果第134-138页
    A.1 发表学术论文第134-135页
    A.2 参与研究课题第135-136页
    A.3 申请或被授权专利第136页
    A.4 担任审稿人第136-137页
    A.5 组织学术竞赛第137-138页
附录B 中英文对照表第138-139页

论文共139页,点击 下载论文
上一篇:复杂网络中关键节点的挖掘算法研究
下一篇:中小学教师教育戏剧运用的理论与实践研究