面向网络渗透社工的用户信息挖掘与分析

摘要	第3-4页
Abstract	第4页
第1章绪论	第8-13页
1.1 研究背景及意义	第8-9页
1.2 用户信息挖掘算法综述	第9-10页
1.3 本课题的研究内容和工作重点	第10-11页
1.4 论文的组织结构	第11-13页
第2章相关理论及技术	第13-19页
2.1 爬虫技术相关介绍	第13-14页
2.1.1 爬虫概述	第13页
2.1.2 爬虫的分类	第13-14页
2.2 模糊匹配算法相关介绍	第14-15页
2.3 数据挖掘概述	第15-18页
2.3.1 基于Web数据挖掘技术概述	第16-17页
2.3.2 文本挖掘概述	第17-18页
2.4 本章小结	第18-19页
第3章用户信息挖掘系统	第19-53页
3.1 系统体系结构	第19-20页
3.2 网络用户信息分析	第20-21页
3.3 非结构化数据获取	第21-29页
3.3.1 基于API的数据获取技术	第22-23页
3.3.2 基于爬虫技术获取数据	第23-29页
3.4 跨网站的用户信息匹配	第29-37页
3.4.1 基于模糊算法的用户信息匹配	第29-30页
3.4.2 匹配算法的改进	第30-32页
3.4.3 算法的相关参数的确定	第32-37页
3.4.4 准确性测试	第37页
3.5 非度量特征提取	第37-51页
3.5.1 中文文本挖掘流程	第38-39页
3.5.2 中文文本挖掘具体算法	第39-49页
3.5.3 挖掘算法的改进	第49-51页
3.6 本章小结	第51-53页
第4章数据库的设计和实现	第53-64页
4.1 数据库简述	第53-55页
4.1.1 数据库模型	第53-54页
4.1.2 数据库需求分析	第54-55页
4.2 MongoDB_HTML数据库设计	第55-58页
4.2.1 GridFS存储机制	第55-57页
4.2.2 Document设计	第57-58页
4.3 MongoDB_json数据库设计	第58-62页
4.3.1 MongoDB_json需求分析	第58-59页
4.3.2 MongoDB_json.CV集合设计	第59-60页
4.3.3 MongoDB_json.Friends集合设计	第60-61页
4.3.4 MongoDB_json.Articles集合设计	第61-62页
4.4 MongoDB_SED数据库设计	第62-63页
4.5 本章小结	第63-64页
第5章系统实现与结果分析	第64-80页
5.1 信息提取系统设计与实现	第64-70页
5.1.1 个人信息CV的提取	第65-67页
5.1.2 朋友圈Friend提取	第67-68页
5.1.3 Article的提取	第68-70页
5.2 跨网站的用户信息匹配实现	第70-73页
5.3 文本挖掘模块的实现	第73-74页
5.4 社工库生成程序	第74-76页
5.5 社工库查询工具设计	第76-79页
5.5.1 社工库查询工具的功能分析	第76页
5.5.2 查询工具的查询算法	第76-77页
5.5.3 查询工具界面设计与实现	第77-79页
5.6 本章小结	第79-80页
第6章总结与展望	第80-82页
参考文献	第82-85页
致谢	第85-86页
个人简历、在学期间发表的学术论文与研究成果	第86页