基于LSTM-RNN的语言模型在K12英语题目中的自动化校验研究
摘要 | 第5-6页 |
ABSTRACT | 第6-7页 |
第1章 绪论 | 第13-20页 |
1.1 研究背景 | 第13-14页 |
1.2 问题的提出 | 第14页 |
1.3 研究目的与意义 | 第14-16页 |
1.3.1 研究目标 | 第14-15页 |
1.3.2 研究意义 | 第15-16页 |
1.4 研究内容与问题 | 第16-17页 |
1.4.1 研究内容 | 第16页 |
1.4.2 研究问题 | 第16-17页 |
1.5 研究过程 | 第17页 |
1.6 论文的创新与独特之处 | 第17-18页 |
1.7 论文的框架结构 | 第18-20页 |
第2章 相关研究现状 | 第20-28页 |
2.1 项目反应理论 | 第20-21页 |
2.1.1 项目反应理论 | 第20页 |
2.1.2 信息量与信息函数 | 第20-21页 |
2.2 自适应测试和个性化练习 | 第21-24页 |
2.2.1 计算机化自适应测试(CAT) | 第21-23页 |
2.2.2 个性化练习简介 | 第23-24页 |
2.3 国内外研究现状 | 第24-28页 |
2.3.1 国内研究现状 | 第24-25页 |
2.3.2 国外研究现状 | 第25-28页 |
第3章 语言模型的提出 | 第28-39页 |
3.1 词向量的选择 | 第29-33页 |
3.1.1 一位有效编码的应用与优劣 | 第29-31页 |
3.1.2 词向量的应用与优劣 | 第31-33页 |
3.2 神经网络的选择 | 第33-39页 |
3.2.1 普通循环神经网络的优劣 | 第33-35页 |
3.2.2 长短期记忆循环神经网络的优劣 | 第35-39页 |
第4章 模型的工程化实现 | 第39-61页 |
4.1 获取训练语料的高性能爬虫 | 第39-44页 |
4.1.1 爬虫获取语料对象选择 | 第39-40页 |
4.1.2 高性能爬虫的技术选型 | 第40-42页 |
4.1.3 高性能爬虫开发工程流程 | 第42-44页 |
4.2 操作大型数据集的数据清洗 | 第44-49页 |
4.2.1 清洗的原型数据述 | 第45页 |
4.2.2 数据取引擎开发工程流程 | 第45-49页 |
4.3 NLTK特征提取 | 第49-52页 |
4.3.1 NLTK应用方式选择 | 第49-50页 |
4.3.2 NLTK取音素工程流程 | 第50-52页 |
4.4 word2vec应用开发工程流程 | 第52-56页 |
4.5 LSTM-RNN工程流程 | 第56-61页 |
第5章 语言模型输出结果讨论及应用 | 第61-68页 |
5.1 LSTM-RNN最终输出结果讨论 | 第61-65页 |
5.1.1 样例数据展示 | 第61-62页 |
5.1.2 效果分析及实际应用 | 第62-65页 |
5.2 可能存在的问题及解决方案 | 第65-68页 |
第6章 总结与展望 | 第68-72页 |
6.1 研究总结 | 第68-69页 |
6.2 研究局限 | 第69-70页 |
6.3 研究展望 | 第70-72页 |
参考文献 | 第72-76页 |
后记 | 第76页 |