首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于字词对齐的中文字词向量表示方法

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第14-20页
    1.1 研究问题概述第14-15页
    1.2 研究背景及现状第15-17页
    1.3 研究内容第17页
    1.4 本文的结构第17-20页
第二章 分布式词向量表示方法第20-32页
    2.1 分布式语义表示第20-21页
    2.2 基于矩阵分解的分布式词向量技术第21-23页
        2.2.1 基于矩阵分解表示技术步骤第21页
        2.2.2 显式正定点互信息矩阵表示第21-22页
        2.2.3 分布式表示的奇异值分解第22页
        2.2.4 Global Vectors表示方法第22-23页
    2.3 基于神经网络的词向量表示技术第23-27页
        2.3.1 神经网络语言模型第23-24页
        2.3.2 语言模型第24页
        2.3.3 n元组语言模型第24页
        2.3.4 神经网络语言模型第24-26页
        2.3.5 CBOW和Skip-Gram模型第26-27页
    2.4 中文词向量表示技术第27-30页
        2.4.1 基于位置的消歧方法第28-29页
        2.4.2 基于聚类的表示方法第29页
        2.4.3 非参数化聚类方法第29-30页
    2.5 本章小结第30-32页
第三章 中文字词联合学习第32-44页
    3.1 获取中文字词的翻译第32-33页
    3.2 基于字词对齐模型的相似度计算第33-37页
        3.2.1 预训练英文词向量第33-34页
        3.2.2 字语义合并第34-35页
        3.2.3 计算字词相似度和消歧第35-37页
    3.3 字词联合训练的字词向量模型第37-41页
        3.3.1 SCWE模型第37-40页
        3.3.2 基于相似度的字词联合学习方法第40-41页
    3.4 模型复杂度分析第41-42页
    3.5 本章小结第42-44页
第四章 实验分析第44-58页
    4.1 词向量实验设置第44-45页
        4.1.1 英文词向量的训练第44-45页
        4.1.2 中文词向量的训练第45页
    4.2 语义相关性实验第45-49页
        4.2.1 语料库大小的影响第47-48页
        4.2.2 近邻词汇分析第48-49页
    4.3 文本分类第49-52页
        4.3.1 实验数据介绍第49页
        4.3.2 分类算法和评价标准第49-52页
    4.4 汉字消歧第52-54页
        4.4.1 汉字消歧的量化实验第53页
        4.4.2 字向量在二维平面的显示第53-54页
    4.5 参数分析第54-56页
        4.5.1 建模比例参数β第54-55页
        4.5.2 组合词判定阈值λ第55-56页
        4.5.3 汉字多义合并阈值δ第56页
    4.6 本章小结第56-58页
第五章 总结与展望第58-60页
    5.1 总结第58-59页
    5.2 展望第59-60页
参考文献第60-62页
致谢第62-64页
在读期间发表的学术论文与取得的研究成果第64页

论文共64页,点击 下载论文
上一篇:基于用户评论的自动化音乐分类方法
下一篇:面向双向隐私保护的群智感知技术研究