| 摘要 | 第4-5页 |
| Abstract | 第5页 |
| 第一章 绪论 | 第8-15页 |
| 1.1 引言 | 第8页 |
| 1.2 国内外研究现状 | 第8-12页 |
| 1.2.1 P2P网络研究现状 | 第10页 |
| 1.2.2 对等网络数据挖掘研究现状 | 第10-11页 |
| 1.2.3 对等网络文本查重检测研究现状 | 第11页 |
| 1.2.4 对等网络图像抄袭检测研究现状 | 第11-12页 |
| 1.3 研究的目的和意义 | 第12-13页 |
| 1.3.1 研究的意义 | 第12-13页 |
| 1.3.2 研究的目的 | 第13页 |
| 1.4 研究内容及章节安排 | 第13-15页 |
| 第二章 对等网络架构及关键技术 | 第15-24页 |
| 2.1 对等网络概述 | 第15-16页 |
| 2.2 对等网络socket通信 | 第16-21页 |
| 2.2.1 对等网络数据传输基础协议 | 第17页 |
| 2.2.2 对等网络文本传输模型 | 第17-18页 |
| 2.2.3 对等网络数据通信工作原理 | 第18-20页 |
| 2.2.4 网络应用层数据包压缩 | 第20页 |
| 2.2.5 网络数据多线程传输和断点续传 | 第20-21页 |
| 2.3 B编码介绍 | 第21页 |
| 2.4 网络加密系统介绍 | 第21-22页 |
| 2.5 高维快速排序算法 | 第22-24页 |
| 第三章 对等网络数据挖掘 | 第24-33页 |
| 3.1 Apriori关联规则数据挖掘算法 | 第24-26页 |
| 3.2 对等网络数据挖掘 | 第26-28页 |
| 3.3 对等网络数据挖掘数据解析 | 第28-31页 |
| 3.3.1 技术水平相关性 | 第29页 |
| 3.3.2 投入相关性 | 第29页 |
| 3.3.3 利润产出相关性 | 第29-30页 |
| 3.3.4 产学研科技成果相关性 | 第30页 |
| 3.3.5 科技成果负责人相关性 | 第30-31页 |
| 3.3.6 科技成果完成人年龄相关性 | 第31页 |
| 3.3.7 知识结论 | 第31页 |
| 3.4 计算时间效率分析 | 第31-33页 |
| 第四章 分布式文本查重 | 第33-44页 |
| 4.1 文本查重 | 第33页 |
| 4.2 Simhash算法原理及第四步信息熵无损压缩证明 | 第33-35页 |
| 4.3 空间相识度 | 第35页 |
| 4.4 中文分词 | 第35-38页 |
| 4.4.1 正向最大匹配分词 | 第36-37页 |
| 4.4.2 逆向最大匹配分词 | 第37-38页 |
| 4.5 抄袭的法律定义 | 第38页 |
| 4.6 分布式对等文本数据查重算法 | 第38-40页 |
| 4.7 特征值分片计算和汉明距离不完全计算加速算法 | 第40-41页 |
| 4.8 算法时间效率分析 | 第41页 |
| 4.9 查重效果展示 | 第41-44页 |
| 第五章 对等网络图像查重计算 | 第44-58页 |
| 5.1图像特征值提取及特征效率 | 第44-49页 |
| 5.2 YCbCr空间图像特征提取 | 第49-52页 |
| 5.3 图像分布式查重检索 | 第52-53页 |
| 5.4 图像抄袭检测效果展示 | 第53-58页 |
| 第六章 总结与展望 | 第58-60页 |
| 参考文献 | 第60-62页 |
| 致谢 | 第62-63页 |
| 个人简历、在学期间的研究成果及发表的学术论文 | 第63页 |