摘要 | 第3-4页 |
ABSTRACT | 第4-5页 |
第1章 绪论 | 第9-15页 |
1.1 研究背景与意义 | 第9-10页 |
1.1.1 研究背景 | 第9页 |
1.1.2 研究意义 | 第9-10页 |
1.2 资源调查现状 | 第10-11页 |
1.3 研究目标与内容 | 第11-14页 |
1.3.1 研究目标 | 第11-12页 |
1.3.2 研究内容 | 第12-14页 |
1.4 本文组织结构 | 第14-15页 |
第2章 相关概念及技术介绍 | 第15-29页 |
2.1 中小学网络教学资源 | 第15-17页 |
2.1.1 网络教学资源的概念界定 | 第15-16页 |
2.1.2 网络教学资源的特点 | 第16-17页 |
2.1.3 资源同质性 | 第17页 |
2.2 大数据技术 | 第17-21页 |
2.2.1 开源平台Hadoop | 第18-19页 |
2.2.2 大数据关键技术 | 第19-21页 |
2.2.2.1 分布式文件系统HDFS | 第19-20页 |
2.2.2.2 分布式编程模型MapReduce | 第20-21页 |
2.3 文本模型简介 | 第21-24页 |
2.3.1 VSM模型 | 第21-22页 |
2.3.2 pLSA主题模型 | 第22页 |
2.3.3 LDA主题模型 | 第22-24页 |
2.4 资源分析算法 | 第24-29页 |
2.4.1 模式匹配算法 | 第25-26页 |
2.4.2 文本相似度分析算法 | 第26页 |
2.4.3 聚类分析算法 | 第26-29页 |
2.4.3.1 基于划分的聚类算法 | 第26-27页 |
2.4.3.2 基于层次的聚类算法 | 第27-29页 |
第3章 网络教学资源采集与处理 | 第29-41页 |
3.1 噪音数据处理 | 第29-33页 |
3.1.1 资源载体组织结构 | 第30页 |
3.1.2 资源数据预处理 | 第30-31页 |
3.1.3 资源数据清洗 | 第31-32页 |
3.1.4 资源数据提取 | 第32-33页 |
3.2 资源集成 | 第33-36页 |
3.3 HADOOP云平台的搭建与编程环境设置 | 第36-40页 |
3.3.1 Hadoop云平台搭建 | 第36-39页 |
3.3.2 编程环境设置 | 第39-40页 |
3.4 本章小结 | 第40-41页 |
第4章 网络教学资源分析与处理 | 第41-53页 |
4.1 分析模型概述 | 第41页 |
4.2 学科和地域研究 | 第41-45页 |
4.2.1 向量模型建立 | 第42-44页 |
4.2.1.1 认识Web链接结构 | 第42-43页 |
4.2.1.2 向量模型建立步骤 | 第43-44页 |
4.2.2 学科和地域属性分析 | 第44-45页 |
4.3 同质性研究 | 第45-52页 |
4.3.1 LDA在Mahout下的实现 | 第46-48页 |
4.3.1.1 LDA算法并行化思想 | 第46-47页 |
4.3.1.2 基于MapReduce的LDA算法并行化实现 | 第47-48页 |
4.3.2 聚类算法在Mahout下的实现 | 第48-52页 |
4.3.2.1 层次聚类数据划分策略 | 第49-50页 |
4.3.2.2 基于MapReduce的层次聚类算法 | 第50页 |
4.3.2.3 基于MapReduce的层次聚类算法实现 | 第50-52页 |
4.4 本章小结 | 第52-53页 |
第5章 实验结果与分析 | 第53-67页 |
5.1 网络教学资源库 | 第53-56页 |
5.1.1 实验与分析 | 第53-54页 |
5.1.2 资源库现状调查 | 第54-56页 |
5.2 资源学科和地域类型 | 第56-60页 |
5.2.1 实验与分析 | 第56-58页 |
5.2.2 资源学科和地域现状 | 第58-60页 |
5.3 网络教学资源同质性 | 第60-66页 |
5.3.1 实验与分析 | 第60-63页 |
5.3.2 同质性分析 | 第63-66页 |
5.4 本章小结 | 第66-67页 |
第6章 总结与展望 | 第67-69页 |
6.1 总结 | 第67页 |
6.2 展望 | 第67-69页 |
参考文献 | 第69-71页 |
致谢 | 第71页 |