摘要 | 第4-5页 |
Abstract | 第5-6页 |
第1章 绪论 | 第10-21页 |
1.1 研究背景、目的及意义 | 第10-11页 |
1.1.1 研究背景 | 第10-11页 |
1.1.2 研究目的 | 第11页 |
1.1.3 研究意义 | 第11页 |
1.2 国内外相关研究综述 | 第11-17页 |
1.2.1 搜索引擎广告研究综述 | 第11-13页 |
1.2.2 短文本分析研究综述 | 第13-14页 |
1.2.3 用户画像研究综述 | 第14-16页 |
1.2.4 综述小结 | 第16-17页 |
1.3 研究内容、研究方法及技术路线 | 第17-21页 |
1.3.1 研究内容 | 第17-18页 |
1.3.2 研究方法 | 第18-19页 |
1.3.3 技术路线 | 第19-21页 |
第2章 基于搜索数据的用户画像研究框架构建 | 第21-34页 |
2.1 用户画像研究框架 | 第21-22页 |
2.2 基础数据收集 | 第22-23页 |
2.3 混合特征理论模型 | 第23-26页 |
2.3.1 特征选择原则 | 第23-24页 |
2.3.2 特征分析 | 第24页 |
2.3.3 混合特征模型构建思路及技术选择 | 第24-26页 |
2.4 用户画像理论模型 | 第26-34页 |
2.4.1 用户画像标签维度 | 第26-28页 |
2.4.2 用户画像构建流程 | 第28-29页 |
2.4.3 用户画像基本属性模型构建思路及技术选择 | 第29-31页 |
2.4.4 用户画像喜好模型构建思路及技术选择 | 第31-34页 |
第3章 基于搜索数据的混合特征模型 | 第34-50页 |
3.1 数据来源与整理 | 第34-36页 |
3.2 数据预处理 | 第36-39页 |
3.2.1 停用词处理 | 第36页 |
3.2.2 样本分词 | 第36-38页 |
3.2.3 缺失样本处理 | 第38-39页 |
3.3 混合特征模型 | 第39-48页 |
3.3.1 Doc2Vec 特征提取 | 第39-41页 |
3.3.2 TF-IDF特征提取 | 第41-43页 |
3.3.3 人工特征提取 | 第43-48页 |
3.4 混合特征模型的效果评估 | 第48-50页 |
第4章 基于混合特征的用户画像模型 | 第50-69页 |
4.1 建立用户画像标签 | 第50-51页 |
4.2 用户画像中的用户基本属性模型构建 | 第51-61页 |
4.2.1 基于 Doc2Vec 的神经网络模型 | 第51-54页 |
4.2.2 基于TF-IDF的传统机器学习模型 | 第54-56页 |
4.2.3 基于人工特征的传统机器学习模型 | 第56-58页 |
4.2.4 模型修正 | 第58-60页 |
4.2.5 模型融合 | 第60-61页 |
4.3 用户画像中的用户喜好模型构建 | 第61-67页 |
4.3.1 特征提取 | 第61-63页 |
4.3.2 基于 K-Means 的用户聚类 | 第63-64页 |
4.3.3 建立用户喜好词库表 | 第64-66页 |
4.3.4 基于 Word2Vec 词向量的相似度计算 | 第66-67页 |
4.4 用户画像模型的更新 | 第67-69页 |
第5章 用户画像模型的应用 | 第69-87页 |
5.1 数据描述 | 第69-70页 |
5.2 数据预处理 | 第70-71页 |
5.3 混合特征提取 | 第71-75页 |
5.4 用户画像模型应用及分析 | 第75-87页 |
5.4.1 用户基本属性模型应用及分析 | 第75-79页 |
5.4.2 用户喜好模型应用及分析 | 第79-85页 |
5.4.3 用户画像模型预测结果分析 | 第85-87页 |
第6章 总结与展望 | 第87-89页 |
6.1 总结 | 第87页 |
6.2 创新点 | 第87-88页 |
6.3 不足与展望 | 第88-89页 |
6.3.1 研究不足 | 第88页 |
6.3.2 研究展望 | 第88-89页 |
致谢 | 第89-90页 |
参考文献 | 第90-95页 |
攻读硕士学位期间的主要科研成果 | 第95-96页 |
附录 A | 第96-100页 |