基于用户特征的社交网络数据挖掘研究
| 致谢 | 第1-6页 |
| 中文摘要 | 第6-8页 |
| ABSTRACT | 第8-14页 |
| 1 绪论 | 第14-34页 |
| ·研究背景与选题意义 | 第14-16页 |
| ·研究背景 | 第14-15页 |
| ·选题意义 | 第15-16页 |
| ·复杂网络理论与数据挖掘相关研究方法 | 第16-27页 |
| ·复杂网络理论 | 第16-18页 |
| ·互联网实证分析 | 第18-19页 |
| ·信息获取与文本处理技术 | 第19-20页 |
| ·推荐算法 | 第20-22页 |
| ·机器学习与预测算法 | 第22-24页 |
| ·信息传播基本模型与方法 | 第24-27页 |
| ·研究的困难与现有研究的不足 | 第27-30页 |
| ·论文的主要研究内容和创新点 | 第30-32页 |
| ·论文的结构 | 第32-34页 |
| 2 互联网信息抓取与文本处理 | 第34-58页 |
| ·引言 | 第34页 |
| ·网络爬虫与数据处理 | 第34-43页 |
| ·基于Nutch的并行爬虫设计 | 第34-36页 |
| ·网页清洗与信息提取 | 第36-38页 |
| ·海量网页快速消重算法 | 第38-41页 |
| ·算法与模型测试 | 第41-43页 |
| ·基于wrapper的信息处理模型 | 第43-50页 |
| ·URL模版 | 第43-45页 |
| ·网页wrapper设计 | 第45-48页 |
| ·系统实现与性能测试 | 第48-50页 |
| ·自动摘要算法 | 第50-56页 |
| ·文档权重分析 | 第50-52页 |
| ·词条权重计算 | 第52-53页 |
| ·单句权重计算 | 第53-54页 |
| ·摘要生成与算法评估 | 第54-56页 |
| ·本章小结 | 第56-58页 |
| 3 微博社交网络数据挖掘与用户权重分析 | 第58-84页 |
| ·引言 | 第58页 |
| ·微博社交网络特征分析 | 第58-72页 |
| ·微博数据采集 | 第58-60页 |
| ·用户特征分析 | 第60-66页 |
| ·微博特征分析 | 第66-68页 |
| ·用户影响力与群体结构演化分析 | 第68-72页 |
| ·用户权重排序算法 | 第72-82页 |
| ·基于HITS算法的节点权重分析 | 第72-74页 |
| ·用户影响力模型 | 第74-77页 |
| ·用户活跃度模型 | 第77页 |
| ·用户权重模型与参数选择 | 第77-79页 |
| ·算法评估 | 第79-82页 |
| ·本章小结 | 第82-84页 |
| 4 社交网络用户个性推荐算法 | 第84-108页 |
| ·引言 | 第84-85页 |
| ·基于统计特征的用户个性化推荐算法 | 第85-91页 |
| ·微博话题短文本聚类算法 | 第85-87页 |
| ·微博社交网络用户偏好性分析 | 第87-88页 |
| ·基于统计特征的微博推荐模型 | 第88-89页 |
| ·模型参数选择与结果评估 | 第89-91页 |
| ·基于用户特征与改进NBI模型的推荐算法 | 第91-99页 |
| ·NBI个性化推荐算法 | 第91-93页 |
| ·基于改进NBI模型的微博推荐算法 | 第93-98页 |
| ·微博推荐模型 | 第98-99页 |
| ·参数选择与算法评估 | 第99-106页 |
| ·训练集与测试集 | 第99-100页 |
| ·基于RS的算法评估 | 第100-104页 |
| ·Hamming Distance个性化推荐评估 | 第104-106页 |
| ·本章小结 | 第106-108页 |
| 5 基于机器学习的信息预测算法 | 第108-148页 |
| ·引言 | 第108-109页 |
| ·基于逻辑回归的社交网络拓扑关系预测模型 | 第109-124页 |
| ·用户相似度分析 | 第109-110页 |
| ·数据集说明 | 第110-111页 |
| ·新浪微博用户相似度模型分析 | 第111-113页 |
| ·模型分析与选择 | 第113-117页 |
| ·逻辑回归模型参数训练方法 | 第117-119页 |
| ·逻辑回归并行化投票模型 | 第119-121页 |
| ·试验结果与分析 | 第121-124页 |
| ·基于SVM的社交网络拓扑关系预测模型 | 第124-139页 |
| ·模型分析 | 第124-125页 |
| ·SVM模型 | 第125-128页 |
| ·模型参数训练过程 | 第128-132页 |
| ·SVM模型松弛变量优化分析 | 第132-137页 |
| ·SVM模型并行化处理 | 第137-138页 |
| ·试验结果与分析 | 第138-139页 |
| ·社交网络中信息传播关系预测 | 第139-146页 |
| ·蒙特卡罗仿真模型 | 第139-142页 |
| ·基于机器学习的先验概率计算 | 第142-144页 |
| ·仿真结果与分析 | 第144-146页 |
| ·本章小结 | 第146-148页 |
| 6 总结与展望 | 第148-152页 |
| ·论文的工作总结 | 第148-150页 |
| ·研究展望 | 第150-152页 |
| 参考文献 | 第152-166页 |
| 作者简历 | 第166-170页 |
| 学位论文数据集 | 第170页 |