基于WEB的中文社交网站用户属性推测的研究与分析

摘要	第4-5页
abstract	第5-6页
第一章绪论	第13-21页
1.1 研究背景和意义	第13-15页
1.1.1 研究背景	第13-14页
1.1.2 研究意义	第14-15页
1.2 用户属性推测研究现状与待解决问题	第15-19页
1.2.1 基于有监督学习算法的用户属性推测的研究	第15-17页
1.2.2 基于半监督学习算法的用户属性推测研究	第17-18页
1.2.3 待解决问题	第18-19页
1.3 本文的主要工作和结构安排	第19-21页
1.3.1 主要工作	第19页
1.3.2 结构安排	第19-21页
第二章基于Hadoop分布式软件架构的用户信息抓取与存储	第21-34页
2.1 Hadoop分布式软件架构简介	第21-22页
2.2 基于核的学习Hadoop分布式软件架构的结构体系介绍	第22-26页
2.2.1 HDFS体系结构	第22-23页
2.2.2 MapReduce体系结构	第23-25页
2.2.3 HBase体系结构	第25-26页
2.3 基于Hadoop分布式软件架构的用户数据采集与存储	第26-30页
3.3.1 Hadoop集群的搭建	第26-27页
3.3.2 用户数据的采集	第27-29页
3.3.3 网页DOM树介绍	第29-30页
3.3.4 用户数据的存储	第30页
2.4 计算机性能的对比实验	第30-33页
2.4.1 单机环境下计算机的CPU和内存占用率实验	第30-31页
2.4.2 计算机CPU变化对比实验	第31-32页
2.4.3 计算机内存特性变化对比试验	第32-33页
2.5 本章小结	第33-34页
第三章基于文本的中文用户性别推测	第34-53页
3.1 引言	第34页
3.2 实施方案	第34-44页
3.2.1 基于文本的中文用户性别推测算法	第36-39页
3.2.2 算法能力评价	第39-40页
3.2.3 用户数据采集	第40页
3.2.4 用户数据处理	第40-41页
3.2.5 构造样本语料库	第41-44页
3.3 实验对比与分析	第44-52页
3.4 本章小结	第52-53页
第四章基于遗传算法优化支持向量机组合参数和特征属性的用户年龄分布推测	第53-68页
4.1 引言	第53页
4.2 支持向量机算法和遗传算法介绍	第53-57页
4.2.1 支持向量机算法	第53-56页
4.2.2 遗传算法介绍	第56-57页
4.3 实验实施方案	第57-60页
4.3.1 样本特征向量选择	第57页
4.3.2 支持向量机性能的评价能力	第57页
4.3.3 支持向量机参数的作用以及优化	第57-58页
4.3.4 特征属性选择对于支持向量机分类能力的作用和优化	第58页
4.3.5 组合参数和特征属性的共同优化	第58页
4.3.6 遗传算法优化支持向量机的组合参数和特征属性	第58-60页
4.4 仿真实验	第60-67页
4.4.1 数据源	第60页
4.4.2 实验设计	第60-61页
4.4.3 特征选择	第61-64页
4.4.4 实验结果和分析	第64-67页
4.5 本章小结	第67-68页
第五章基于遗传算法优化支持向量机组合参数和特征属性的用户教育程度分布推测	第68-75页
5.1 引言	第68页
5.2 仿真实验	第68-74页
5.2.1 数据源	第68页
5.2.2 实验设计	第68-69页
5.2.3 特征选择	第69-70页
5.2.4 实验结果和分析	第70-74页
5.3 本章小结	第74-75页
第六章总结与展望	第75-77页
参考文献	第77-83页
致谢	第83-84页
在学期间的研究成果及发表的学术论文	第84页