微博应用中“转世账号”的研判技术与实现
| 摘要 | 第8-10页 |
| ABSTRACT | 第10-11页 |
| 第一章 绪论 | 第12-20页 |
| 1.1 研究背景与意义 | 第12-13页 |
| 1.2 本文研究内容 | 第13-15页 |
| 1.3 研究现状 | 第15-18页 |
| 1.3.1 基于基本属性的用户身份研究 | 第15-16页 |
| 1.3.2 基于图的相似用户研判 | 第16-17页 |
| 1.3.3 基于行为模型方法的用户身份研究 | 第17-18页 |
| 1.4 论文组织 | 第18-20页 |
| 第二章 相关技术研究 | 第20-31页 |
| 2.1 文本预处理技术 | 第20-27页 |
| 2.1.1 文本分词与词性标注技术 | 第20-21页 |
| 2.1.2 命名实体识别技术 | 第21-22页 |
| 2.1.3 停用词过滤 | 第22页 |
| 2.1.4 文本向量化 | 第22-25页 |
| 2.1.5 正则表达式 | 第25-27页 |
| 2.2 文本相似性算法 | 第27-31页 |
| 2.2.1 余弦相似度算法 | 第27-28页 |
| 2.2.2 最少编辑距离相似度算法 | 第28-31页 |
| 第三章 基于时序和相似性的转世账号研判模型 | 第31-40页 |
| 3.1 转世账号特点分析 | 第31-32页 |
| 3.1.1 转世账号解释及信息来源选取 | 第31-32页 |
| 3.1.2 转世账号特点 | 第32页 |
| 3.2 转世账号研判模型简介 | 第32-34页 |
| 3.2.1 形式化定义 | 第32-33页 |
| 3.2.2 模型总体框架 | 第33-34页 |
| 3.3 产生待查账户候选账户集I | 第34-35页 |
| 3.4 基于时序的筛选验证 | 第35-37页 |
| 3.5 基于改进的相似度算法的筛选验证 | 第37-39页 |
| 3.5.1 账户名相似度 | 第37页 |
| 3.5.2 博文内容相似度 | 第37-38页 |
| 3.5.3 相似度筛选验证算法 | 第38-39页 |
| 3.6 本章小结 | 第39-40页 |
| 第四章 转世账号判定的实现及结果分析 | 第40-60页 |
| 4.1 实验数据准备 | 第40-42页 |
| 4.2 候选集产生模块的实现与结果分析 | 第42-44页 |
| 4.2.1 候选集产生模块设计实现 | 第42-43页 |
| 4.2.2 候选集产生模块实验结果分析 | 第43-44页 |
| 4.3 时序筛选验证的设计实现与实验结果分析 | 第44-46页 |
| 4.3.1 时序筛选验证的设计实现 | 第44-46页 |
| 4.3.2 时序筛选验证实验结果分析 | 第46页 |
| 4.4 相似度筛选验证的设计实现与实验结果分析 | 第46-54页 |
| 4.4.1 相似度筛选验证的设计实现 | 第46-50页 |
| 4.4.2 相似度筛选验证的实验结果分析 | 第50-54页 |
| 4.5 总体实验结果分析 | 第54-58页 |
| 4.5.1 模型总体实现 | 第54-55页 |
| 4.5.2 模型性能指标分析 | 第55-56页 |
| 4.5.3 结果分析 | 第56-58页 |
| 4.6 本章小结 | 第58-60页 |
| 第五章 结束语 | 第60-63页 |
| 5.1 研究结论 | 第60-61页 |
| 5.2 研究展望 | 第61-63页 |
| 致谢 | 第63-65页 |
| 参考文献 | 第65-68页 |
| 作者在学期间取得的学术成果 | 第68页 |