基于深度学习的中文词表示学习技术研究
摘要 | 第5-7页 |
ABSTRACT | 第7-8页 |
第1章 绪论 | 第17-29页 |
1.1 引言 | 第17-23页 |
1.1.1 中文信息处理的机遇与挑战 | 第17-20页 |
1.1.2 表示学习与自然语言处理 | 第20-21页 |
1.1.3 语言表示的研究现状 | 第21-23页 |
1.2 论文的主要研究工作 | 第23-26页 |
1.2.1 中文表示学习面临的挑战 | 第23-24页 |
1.2.2 论文的主要工作 | 第24-26页 |
1.3 论文的组织结构 | 第26-29页 |
第2章 现有词表示学习方法 | 第29-41页 |
2.1 引言 | 第29页 |
2.2 词表示方法 | 第29-39页 |
2.2.1 离散表示 | 第29-30页 |
2.2.2 基于矩阵的分布式表示 | 第30-31页 |
2.2.3 基于神经网络的分布式表示 | 第31-39页 |
2.3 小结 | 第39-41页 |
第3章 基于笔画的汉字编码 | 第41-55页 |
3.1 引言 | 第41-42页 |
3.2 C2S:汉字转笔顺编码序列 | 第42-45页 |
3.3 基于笔画的汉字识别 | 第45-54页 |
3.3.1 手写汉字识别 | 第45-47页 |
3.3.2 相关工作 | 第47-48页 |
3.3.3 笔画的提取 | 第48-51页 |
3.3.4 基于卷积神经网络的手写汉字模型 | 第51-52页 |
3.3.5 实验和分析 | 第52-54页 |
3.4 小结 | 第54-55页 |
第4章 基于笔画的中文词向量表示学习 | 第55-81页 |
4.1 引言 | 第55-59页 |
4.1.1 中文细粒度划分 | 第55-56页 |
4.1.2 语素文字特性分析 | 第56-59页 |
4.2 相关工作 | 第59-64页 |
4.2.1 字符粒度表示学习 | 第59-61页 |
4.2.2 细粒度中文词向量表示学习 | 第61-64页 |
4.3 基于笔画的中文词向量 | 第64-71页 |
4.3.1 中文的拼音与笔画 | 第64-68页 |
4.3.2 基于相似部件的笔画表示学习 | 第68-69页 |
4.3.3 基于笔画的字词向量构建 | 第69-71页 |
4.4 实验和分析 | 第71-79页 |
4.4.1 实验环境 | 第71页 |
4.4.2 基于问卷调查的结果分析 | 第71-73页 |
4.4.3 相似词分析 | 第73页 |
4.4.4 基于笔画的文本分类 | 第73-76页 |
4.4.5 基于笔画的文本摘要 | 第76-79页 |
4.5 小结 | 第79-81页 |
第5章 基于多维度的中文词向量表示学习 | 第81-93页 |
5.1 引言 | 第81-82页 |
5.2 相关工作 | 第82-86页 |
5.2.1 基于字序的中文词向量 | 第83-85页 |
5.2.2 基于偏旁的中文词向量 | 第85-86页 |
5.3 基于多维度的中文词向量 | 第86-90页 |
5.3.1 基于多维度分层模型 | 第86-87页 |
5.3.2 基于神经网络的多维度分层模型 | 第87-89页 |
5.3.3 分布式多维度中文词表示学习模型构建 | 第89-90页 |
5.4 实验和分析 | 第90-91页 |
5.4.1 基于问卷调查的结果分析 | 第90页 |
5.4.2 基于多维度中文词向量的文本分类 | 第90-91页 |
5.5 小结 | 第91-93页 |
第6章 基于笔画的在中文词向量训练过程的性能优化 | 第93-99页 |
6.1 引言 | 第93页 |
6.2 传统的解决策略 | 第93-95页 |
6.3 基于内存的多备份迁移策略 | 第95-97页 |
6.4 实验分析 | 第97-98页 |
6.5 小结 | 第98-99页 |
第7章 总结与展望 | 第99-101页 |
7.1 本文工作总结 | 第99页 |
7.2 未来工作展望 | 第99-101页 |
参考文献 | 第101-111页 |
致谢 | 第111-113页 |
在读期间发表的学术论文与取得的研究成果 | 第113-115页 |