微博应用中“转世账号”的研判技术与实现
摘要 | 第8-10页 |
ABSTRACT | 第10-11页 |
第一章 绪论 | 第12-20页 |
1.1 研究背景与意义 | 第12-13页 |
1.2 本文研究内容 | 第13-15页 |
1.3 研究现状 | 第15-18页 |
1.3.1 基于基本属性的用户身份研究 | 第15-16页 |
1.3.2 基于图的相似用户研判 | 第16-17页 |
1.3.3 基于行为模型方法的用户身份研究 | 第17-18页 |
1.4 论文组织 | 第18-20页 |
第二章 相关技术研究 | 第20-31页 |
2.1 文本预处理技术 | 第20-27页 |
2.1.1 文本分词与词性标注技术 | 第20-21页 |
2.1.2 命名实体识别技术 | 第21-22页 |
2.1.3 停用词过滤 | 第22页 |
2.1.4 文本向量化 | 第22-25页 |
2.1.5 正则表达式 | 第25-27页 |
2.2 文本相似性算法 | 第27-31页 |
2.2.1 余弦相似度算法 | 第27-28页 |
2.2.2 最少编辑距离相似度算法 | 第28-31页 |
第三章 基于时序和相似性的转世账号研判模型 | 第31-40页 |
3.1 转世账号特点分析 | 第31-32页 |
3.1.1 转世账号解释及信息来源选取 | 第31-32页 |
3.1.2 转世账号特点 | 第32页 |
3.2 转世账号研判模型简介 | 第32-34页 |
3.2.1 形式化定义 | 第32-33页 |
3.2.2 模型总体框架 | 第33-34页 |
3.3 产生待查账户候选账户集I | 第34-35页 |
3.4 基于时序的筛选验证 | 第35-37页 |
3.5 基于改进的相似度算法的筛选验证 | 第37-39页 |
3.5.1 账户名相似度 | 第37页 |
3.5.2 博文内容相似度 | 第37-38页 |
3.5.3 相似度筛选验证算法 | 第38-39页 |
3.6 本章小结 | 第39-40页 |
第四章 转世账号判定的实现及结果分析 | 第40-60页 |
4.1 实验数据准备 | 第40-42页 |
4.2 候选集产生模块的实现与结果分析 | 第42-44页 |
4.2.1 候选集产生模块设计实现 | 第42-43页 |
4.2.2 候选集产生模块实验结果分析 | 第43-44页 |
4.3 时序筛选验证的设计实现与实验结果分析 | 第44-46页 |
4.3.1 时序筛选验证的设计实现 | 第44-46页 |
4.3.2 时序筛选验证实验结果分析 | 第46页 |
4.4 相似度筛选验证的设计实现与实验结果分析 | 第46-54页 |
4.4.1 相似度筛选验证的设计实现 | 第46-50页 |
4.4.2 相似度筛选验证的实验结果分析 | 第50-54页 |
4.5 总体实验结果分析 | 第54-58页 |
4.5.1 模型总体实现 | 第54-55页 |
4.5.2 模型性能指标分析 | 第55-56页 |
4.5.3 结果分析 | 第56-58页 |
4.6 本章小结 | 第58-60页 |
第五章 结束语 | 第60-63页 |
5.1 研究结论 | 第60-61页 |
5.2 研究展望 | 第61-63页 |
致谢 | 第63-65页 |
参考文献 | 第65-68页 |
作者在学期间取得的学术成果 | 第68页 |