首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于分布式语义表示的微博文本规范化研究

摘要第4-6页
Abstract第6-7页
第一章 绪论第14-22页
    1.1 选题背景与意义第14-15页
    1.2 什么是非规范词汇第15-16页
    1.3 什么是文本规范化第16页
    1.4 文本规范化研究现状第16-20页
        1.4.1 基于噪声信道模型的方法第16-18页
        1.4.2 基于规范化词典的方法第18-20页
    1.5 本文的主要工作第20-21页
    1.6 本文的组织结构第21-22页
第二章 分布式语义表示第22-26页
    2.1 语义表示方法第22-23页
    2.2 词语的分布表示第23-25页
    2.3 词汇语义相似度第25-26页
第三章 基于分布式语义表示的规范化词典的构建第26-48页
    3.1 问题概述第26-27页
    3.2 相关研究第27-28页
    3.3 总体思路第28-29页
    3.4 语料预处理与分词第29-30页
    3.5 新词发现第30-37页
        3.5.1 新词发现算法流程第30-32页
        3.5.2 方法第32-35页
        3.5.3 实验与分析第35-37页
    3.6 “旧词新用”词的发现第37-40页
        3.6.1 方法第38-39页
        3.6.2 实验与分析第39-40页
    3.7 非规范词集合扩展第40-41页
    3.8 构建规范化词典第41-44页
        3.8.1 方法第41页
        3.8.2 实验与分析第41-44页
    3.9 本章小结第44-48页
第四章 基于神经网络语言模型的微博文本规范化第48-66页
    4.1 问题概述第48页
    4.2 总体思路第48-49页
    4.3 语言模型第49-52页
        4.3.1 n-gram 语言模型第49-50页
        4.3.2 神经网络语言模型第50-52页
    4.4 基于双层GRU的循环神经网络语言模型第52-57页
        4.4.1 模型第52-55页
        4.4.2 训练第55-56页
        4.4.3 实验第56-57页
    4.5 文本规范化模型第57-60页
        4.5.1 转换规则第58页
        4.5.2 特征第58-59页
        4.5.3 解码第59-60页
    4.6 实验第60-64页
        4.6.1 实验方法第61-62页
        4.6.2 实验结果第62-64页
    4.7 本章小结第64-66页
第五章 总结与展望第66-70页
    5.1 本文的主要贡献第66-67页
    5.2 未来工作第67-70页
参考文献第70-78页
致谢第78页

论文共78页,点击 下载论文
上一篇:学术会议综合服务系统的设计与实现
下一篇:基于视频图像的多人脸识别系统的研究与设计