摘要 | 第5-6页 |
Abstract | 第6-7页 |
第一章 绪论 | 第11-19页 |
1.1 研究背景及意义 | 第11-13页 |
1.2 国内外研究现状 | 第13-17页 |
1.2.1 机器解答的研究现状 | 第14-15页 |
1.2.2 文本分类的研究现状 | 第15-16页 |
1.2.3 支持向量机(SVM)的应用现状 | 第16-17页 |
1.3 本文的工作和组织结构 | 第17-19页 |
第二章 相关理论基础 | 第19-29页 |
2.1 文本分类 | 第19-22页 |
2.1.1 文本分类概述 | 第19-21页 |
2.1.2 文本分类的任务 | 第21页 |
2.1.3 文本分类的过程 | 第21-22页 |
2.2 统计学习理论 | 第22-24页 |
2.2.1 机器学习定义 | 第22-23页 |
2.2.2 经验风险最小化原理 | 第23页 |
2.2.3 结构风险最小化原理 | 第23-24页 |
2.3 支持向量机 | 第24-27页 |
2.3.1 最优分类面 | 第25页 |
2.3.2 核函数 | 第25-27页 |
2.3.3 松弛变量 | 第27页 |
2.4 本章小结 | 第27-29页 |
第三章 基于支持向量机的题目类别识别器的设计与实现 | 第29-34页 |
3.1 机器解答概述 | 第29-30页 |
3.2 系统模型 | 第30-31页 |
3.3 详细设计 | 第31-33页 |
3.3.1 训练 | 第32页 |
3.3.2 预测 | 第32-33页 |
3.4 本章小结 | 第33-34页 |
第四章 数学应用题题目样本预处理与向量化表示 | 第34-40页 |
4.1 文本的预处理方法 | 第34-35页 |
4.1.1 文本分词技术 | 第35页 |
4.1.2 停用词处理 | 第35页 |
4.2 文本表示理论 | 第35-36页 |
4.3 实验样本预处理和向量化表示 | 第36-40页 |
4.3.1 数学应用题题目样本预处理 | 第36-38页 |
4.3.2 数学应用题题目样本向量化表示 | 第38-40页 |
第五章 相对运动应用题识别器特征选择 | 第40-45页 |
5.1 文本特征选择方法 | 第40-43页 |
5.1.1 IG信息增益法 | 第40-41页 |
5.1.2 特征词的频率法DF | 第41-42页 |
5.1.3 互信息法MI | 第42页 |
5.1.4 CHI统计法 | 第42-43页 |
5.2 实验特征选择 | 第43-45页 |
第六章 实验与分析 | 第45-56页 |
6.1 题型识别器实验样本 | 第45-47页 |
6.1.1 训练样本 | 第46页 |
6.1.2 测试样本 | 第46页 |
6.1.3 题库文本 | 第46-47页 |
6.2 题型识别器实验步骤 | 第47-54页 |
6.2.1 训练过程 | 第47-51页 |
6.2.2 测试过程 | 第51-54页 |
6.3 题型识别器的实验结果及性能评价 | 第54-55页 |
6.3.1 文本分类的性能评价标准 | 第54-55页 |
6.3.2 题型识别器的性能评价 | 第55页 |
6.4 本章小结 | 第55-56页 |
第七章 总结及展望 | 第56-58页 |
7.1 总结 | 第56页 |
7.2 展望 | 第56-58页 |
参考文献 | 第58-61页 |
攻读硕士期间发表的论文 | 第61-62页 |
致谢 | 第62页 |