中文摘要 | 第4-6页 |
abstract | 第6-7页 |
第1章 绪论 | 第10-18页 |
1.1 课题的研究背景及意义 | 第10-11页 |
1.2 相关领域国内外相关研究的发展现状 | 第11-16页 |
1.2.1 网页特征分析的研究现状 | 第12-14页 |
1.2.2 特征提取技术的研究现状 | 第14-15页 |
1.2.3 网页分类技术的研究现状 | 第15-16页 |
1.3 本文的主要研究内容和组织结构 | 第16-18页 |
第2章 网页关键词特征模型研究 | 第18-28页 |
2.1 网页特征分析 | 第18-22页 |
2.2 Word2vec模型及其优势 | 第22-23页 |
2.3 网页关键词特征模型设计与构建 | 第23-27页 |
2.3.1 特征模型的坐标树表示 | 第23-26页 |
2.3.2 三维关键词特征模型生成 | 第26-27页 |
2.4 本章小结 | 第27-28页 |
第3章 基于特征自学习的中文网页分类算法改进 | 第28-49页 |
3.1 卷积神经网络的基本原理与模型 | 第28-34页 |
3.1.1 卷积神经网络结构 | 第29-34页 |
3.1.2 卷积神经网络优缺点 | 第34页 |
3.2 级联模型中支持向量机的研究 | 第34-37页 |
3.2.1 支持向量机结构与求解 | 第35-36页 |
3.2.2 多分类支持向量机和Softmax | 第36-37页 |
3.3 基于CNN-SVM级联模型的网页分类算法 | 第37-48页 |
3.3.1 基于迁移学习的级联模型 | 第38-39页 |
3.3.2 级联模型的自学习机制 | 第39-42页 |
3.3.3 级联模型中卷积神经网络结构改进分析 | 第42-44页 |
3.3.4 CNN-SVM级联分类算法 | 第44-48页 |
3.4 本章小结 | 第48-49页 |
第4章 基于自学习的中文网页分类系统设计与实现 | 第49-58页 |
4.1 系统总体设计 | 第49-51页 |
4.2 系统功能模块实现 | 第51-57页 |
4.2.1 网页样本爬取与解析 | 第51-53页 |
4.2.2 网页关键词特征生成模块 | 第53页 |
4.2.3 基于自学习功能的分类模块 | 第53-55页 |
4.2.4 数据存储模块 | 第55-56页 |
4.2.5 基于数据增广的次级通道模块 | 第56-57页 |
4.3 本章小结 | 第57-58页 |
第5章 实验结果及分析 | 第58-64页 |
5.1 实验数据 | 第58-59页 |
5.1.1 实验环境 | 第58页 |
5.1.2 网页样本数据 | 第58-59页 |
5.1.3 模型训练参数 | 第59页 |
5.2 结果及分析 | 第59-63页 |
5.2.1 基于自学习的CNN-SVM级联分类性能分析 | 第59-62页 |
5.2.2 基于数据增广的次级通道性能分析 | 第62-63页 |
5.3 本章小结 | 第63-64页 |
第6章 总结与展望 | 第64-67页 |
6.1 全文工作总结 | 第64-65页 |
6.2 下一步工作展望 | 第65-67页 |
致谢 | 第67-68页 |
参考文献 | 第68-71页 |
附录A | 第71-74页 |
攻读硕士学位期间的研究成果 | 第74页 |