摘要 | 第5-6页 |
abstract | 第6页 |
引言 | 第9-10页 |
1 绪论 | 第10-16页 |
1.1 研究背景 | 第10-11页 |
1.2 国内外研究现状 | 第11-13页 |
1.3 主要研究内容 | 第13-14页 |
1.4 论文组织结构 | 第14-16页 |
2 中文文本作者身份识别方法概述分析 | 第16-32页 |
2.1 中文文本作者身份识别流程 | 第16-18页 |
2.2 文体风格特征 | 第18-19页 |
2.3 作者身份识别算法对比分析 | 第19-23页 |
2.3.1 支持向量机算法 | 第20-21页 |
2.3.2 朴素贝叶斯算法 | 第21页 |
2.3.3 决策树算法 | 第21-23页 |
2.4 深度学习算法 | 第23-30页 |
2.4.1 词向量 | 第24-26页 |
2.4.2 TextCNN | 第26-28页 |
2.4.3 长短期记忆神经网络模型 | 第28-29页 |
2.4.4 注意力机制(Attention) | 第29-30页 |
2.5 文本作者身份识别应用领域 | 第30-31页 |
2.6 小结 | 第31-32页 |
3 CABLSTM中文文本作者身份识别模型 | 第32-49页 |
3.1 CABLSTM模型的提出 | 第32页 |
3.2 CABLSTM中文作者身份识别模型流程 | 第32-33页 |
3.3 基于CNN和 Attention机制改进的文本特征提取器 | 第33-37页 |
3.4 基于双向LSTM和 Softmax的分类输出器 | 第37-38页 |
3.5 模型训练 | 第38-41页 |
3.5.1 选择激活函数 | 第38-40页 |
3.5.2 添加Batch Normalization层 | 第40页 |
3.5.3 选择损失函数 | 第40-41页 |
3.6 实验与结果分析 | 第41-48页 |
3.6.1 实验设计 | 第41-43页 |
3.6.2 实验环境 | 第43-44页 |
3.6.3 实验数据 | 第44页 |
3.6.4 实验一:分词工具对于短文本准确率对比结果与分析 | 第44-45页 |
3.6.5 实验二:CABLSTM模型与深度学习算法对比结果与分析 | 第45-47页 |
3.6.6 实验三:CABLSTM模型与传统算法对比结果与分析 | 第47-48页 |
3.7 小结 | 第48-49页 |
4 中文文本作者身份识别系统的设计与实现 | 第49-63页 |
4.1 应用背景 | 第49-50页 |
4.2 系统功能 | 第50-53页 |
4.3 系统实现 | 第53-57页 |
4.3.1 系统流程设计 | 第53-54页 |
4.3.2 数据库设计 | 第54-55页 |
4.3.3 系统各模块设计 | 第55-57页 |
4.4 系统展示 | 第57-60页 |
4.5 系统性能评价 | 第60-62页 |
4.6 小结 | 第62-63页 |
结论 | 第63-65页 |
参考文献 | 第65-69页 |
在学研究成果 | 第69-70页 |
致谢 | 第70页 |