摘要 | 第4-5页 |
Abstract | 第5-6页 |
第一章 绪论 | 第9-15页 |
1.1 研究背景 | 第9-10页 |
1.2 问题和研究难点 | 第10-11页 |
1.3 国内外研究现状 | 第11-13页 |
1.3.1 多标签分类的研究现状 | 第11-12页 |
1.3.2 海量数据处理的研究现状 | 第12-13页 |
1.4 本文主要工作 | 第13页 |
1.5 本文的组织结构 | 第13-15页 |
第二章 基于多标签的海量文本分类的分析 | 第15-30页 |
2.1 多标签的海量文本分类的总体分析 | 第15-16页 |
2.2 网页信息采集关键技术分析 | 第16-18页 |
2.3 多标签分类索引关键技术分析 | 第18-26页 |
2.3.1 多标签聚类技术分析 | 第18-20页 |
2.3.2 文本预处理技术分析 | 第20页 |
2.3.3 文本特征提取技术分析 | 第20-24页 |
2.3.4 分类算法分析 | 第24-26页 |
2.4 海量文本的处理 | 第26-29页 |
2.4.1 海量数据的存储 | 第27-28页 |
2.4.2 海量数据的计算 | 第28-29页 |
2.5 本章小结 | 第29-30页 |
第三章 基于多标签的海量文本分类的设计 | 第30-47页 |
3.1 基于多标签的海量文本分类系统总体设计 | 第30-32页 |
3.1.1 系统设计目标 | 第30-31页 |
3.1.2 基于多标签的文本分类系统的总体架构设计 | 第31-32页 |
3.2 多标签采集与转化子系统详细设计 | 第32-36页 |
3.2.1 多标签的网络爬取 | 第33-34页 |
3.2.2 多标签的解析 | 第34-35页 |
3.2.3 多标签的分布式存储 | 第35-36页 |
3.3 多标签分类索引子系统详细设计 | 第36-47页 |
3.3.1 多标签的自由度控制 | 第37-41页 |
3.3.2 文本的特征向量化 | 第41-43页 |
3.3.3 基于多标签的分类模型的详细设计 | 第43-47页 |
第四章 基于多标签的海量文本分类的实现 | 第47-62页 |
4.1 系统整体架构实现 | 第47-48页 |
4.2 环境系统的搭建 | 第48-50页 |
4.3 系统模块实现的技术细节 | 第50-60页 |
4.3.1 多标签文本的采集与转化的实现 | 第50-53页 |
4.3.2 多标签文本分类索引的实现 | 第53-58页 |
4.3.3 多标签文本分类索引的结果验证 | 第58-60页 |
4.4 系统性能分析 | 第60-61页 |
4.5 本章小结 | 第61-62页 |
第五章 结语 | 第62-64页 |
5.1 论文工作总结 | 第62-63页 |
5.2 进一步研究工作 | 第63-64页 |
参考文献 | 第64-66页 |
致谢 | 第66-67页 |
攻读学位期间发表的学术论文目录 | 第67页 |