新浪微博用户行为分析及预测

摘要	第3-4页
Abstract	第4-5页
1 绪论	第8-14页
1.1 选题背景	第8-9页
1.2 研究现状	第9-10页
1.2.1 国外研究现状	第9页
1.2.2 国内研究现状	第9-10页
1.3 研究的意义	第10页
1.4 主要的研究内容	第10-12页
1.5 本章小结	第12-14页
2 课题相关理论综述	第14-24页
2.1 文本分类相关技术	第14-18页
2.1.1 向量空间模型	第15页
2.1.2 中文分词技术	第15-16页
2.1.3 特征选择方法	第16-17页
2.1.4 特征权重计算方法	第17-18页
2.2 文本分类算法	第18-21页
2.2.2 KNN算法	第18-19页
2.2.3 类中心向量算法	第19-20页
2.2.4 逻辑回归模型	第20-21页
2.3 模糊集理论	第21页
2.3.1 模糊集定义	第21页
2.4 Map Reduce理论简介	第21-22页
2.5 本章小结	第22-24页
3 数据描述及分析	第24-36页
3.1 数据构成的符号集描述如下	第24页
3.2 数据分析	第24-34页
3.2.1 微博整体规律分析	第24-26页
3.2.2 微博特征分析	第26-31页
3.2.3 用户行为分析	第31-32页
3.2.4 用户行为与时间关系的分析	第32-34页
3.3 本章小结	第34-36页
4 建立预测模型	第36-44页
4.1 构建每个用户的中心向量	第36-38页
4.2 改进的KNN算法实现预测	第38-40页
4.2.1 类别集合代替传统的求距离	第38页
4.2.2 用户行为预测过程	第38-40页
4.3 预测结果的评价	第40页
4.4 算法举例	第40-41页
4.5 建立预测模型	第41-43页
4.6 本章小结	第43-44页
5 实例仿真分析	第44-52页
5.1 仿真环境及数据集	第44页
5.2 仿真实施步骤	第44-48页
5.3 评估指标	第48-49页
5.4 仿真结果分析	第49-50页
5.5 本章小结	第50-52页
6 总结与展望	第52-54页
6.1 工作总结	第52页
6.2 工作展望	第52-54页
致谢	第54-56页
参考文献	第56-60页
攻读硕士期间所做课题及发表的学术论文	第60页