文本挖掘技术的研究及其在教学平台中的应用
致谢 | 第1-6页 |
摘要 | 第6-7页 |
ABSTRACT | 第7-11页 |
1 绪论 | 第11-17页 |
·论文的研究背景及选题意义 | 第11-13页 |
·国内外研究现状 | 第13-15页 |
·文本挖掘技术研究现状 | 第14页 |
·主观题自动评分系统研究现状 | 第14-15页 |
·论文主要工作 | 第15页 |
·论文结构安排 | 第15-17页 |
2 主观题自动评分关键技术研究 | 第17-32页 |
·中文分词技术 | 第18-21页 |
·基于词典的分词方法 | 第18-19页 |
·基于统计的分词方法 | 第19-20页 |
·基于理解的分词方法 | 第20页 |
·中文分词开源项目 | 第20-21页 |
·文本相似度计算 | 第21-26页 |
·基于向量空间模型的计算方法 | 第21-24页 |
·基于汉明距离的计算方法 | 第24-25页 |
·基于语义理解的计算方法 | 第25-26页 |
·文本分类 | 第26-32页 |
·训练模块 | 第27-30页 |
·测试和性能评估模块 | 第30-32页 |
3 基于单向贴近度的简答题自动评分算法研究 | 第32-38页 |
·简答题特点及阅卷流程 | 第32页 |
·模糊数学理论 | 第32-34页 |
·模糊数学概述 | 第33-34页 |
·模糊数学的应用 | 第34页 |
·单向贴近度算法应用 | 第34-38页 |
·单向贴近度的定义 | 第34-35页 |
·单向贴近度的计算 | 第35页 |
·主观题评分公式 | 第35-36页 |
·算法举例 | 第36-37页 |
·算法特点总结 | 第37-38页 |
4 基于文本语义相似度的论述题自动评分算法研究 | 第38-50页 |
·论述题特点及阅卷方法 | 第38页 |
·词语语义相似度计算 | 第38-45页 |
·语义相似度与语义距离 | 第38-40页 |
·关于《知网》 | 第40-41页 |
·根据《知网》计算词语语义相似度 | 第41-45页 |
·句子、段落和文本的语义相似度计算 | 第45-50页 |
5 KNN算法改进及实验结果分析 | 第50-57页 |
·KNN算法在主观题自动评分的应用 | 第50-51页 |
·KNN算法原理及其改进 | 第51-54页 |
·类别样本数量差异 | 第51-53页 |
·样本分布密度不均衡 | 第53-54页 |
·实验与结果分析 | 第54-57页 |
·实验数据集 | 第54页 |
·性能评价指标 | 第54-55页 |
·实验工具与方法 | 第55页 |
·实验结果分析 | 第55-57页 |
6 算法实现及实验结果分析 | 第57-67页 |
·功能设计 | 第57-58页 |
·功能设计基本原则 | 第57页 |
·功能设计思想 | 第57-58页 |
·功能设计内容 | 第58页 |
·开发环境 | 第58页 |
·功能实现 | 第58-61页 |
·关键步骤的实现 | 第59-60页 |
·功能展示 | 第60-61页 |
·实验结果分析 | 第61-67页 |
·实验数据选取 | 第61-62页 |
·实验评价指标 | 第62-63页 |
·实验结果分析 | 第63-67页 |
7 总结与展望 | 第67-69页 |
参考文献 | 第69-72页 |
附录A | 第72-74页 |
作者简历 | 第74-76页 |
学位论文数据集 | 第76页 |