摘要 | 第5-6页 |
ABSTRACT | 第6页 |
第一章 绪论 | 第10-14页 |
1.1 研究背景及意义 | 第10-11页 |
1.2 国内外的研究现状 | 第11-12页 |
1.3 本文研究内容 | 第12-13页 |
1.4 论文组织结构 | 第13-14页 |
第二章 文档相似性度量技术概述 | 第14-23页 |
2.1 文档相似性度量基本概念 | 第14-16页 |
2.2 文档相似性度量技术分析 | 第16-22页 |
2.3 本章小结 | 第22-23页 |
第三章 基于相似度估计的文档复制检测系统的需求分析 | 第23-34页 |
3.1 业务流程 | 第23-24页 |
3.2 功能需求 | 第24-32页 |
3.2.1 身份认证 | 第24-25页 |
3.2.2 项目信息预处理 | 第25-27页 |
3.2.3 项目相似度计算 | 第27-29页 |
3.2.4 相似项目的结果查询和导出 | 第29-30页 |
3.2.5 系统配置 | 第30-32页 |
3.3 安全要求 | 第32页 |
3.4 性能要求 | 第32-33页 |
3.4.1 数据精确度和时间特性 | 第32-33页 |
3.4.2 灵活性 | 第33页 |
3.5 本章小结 | 第33-34页 |
第四章 基于相似度估计的文档复制检测系统的设计 | 第34-56页 |
4.1 系统总体设计 | 第34-42页 |
4.1.1 运行环境 | 第34-35页 |
4.1.2 总体功能结构 | 第35-37页 |
4.1.3 系统的层次结构 | 第37页 |
4.1.4 硬件架构 | 第37-38页 |
4.1.5 全局配置说明 | 第38-39页 |
4.1.6 命名规则 | 第39-40页 |
4.1.7 文件存放目录 | 第40-42页 |
4.2 各子系统模块设计 | 第42-49页 |
4.2.1 项目预处理子系统 | 第42-45页 |
4.2.2 项目相似度计算子系统 | 第45-46页 |
4.2.3 相似度项目的查询呈现和导出子系统 | 第46-49页 |
4.3 数据库设计 | 第49-55页 |
4.3.1 库表设计说明 | 第50-51页 |
4.3.2 库表关系说明 | 第51-53页 |
4.3.3 表结构 | 第53-55页 |
4.4 本章小结 | 第55-56页 |
第五章 基于相似性估计的文档复制检测系统的实现 | 第56-76页 |
5.1 系统实现环境 | 第56页 |
5.2 项目信息提取的实现 | 第56-63页 |
5.2.1 项目信息的提取 | 第56-58页 |
5.2.2 项目聚类 | 第58-59页 |
5.2.3 相似度估值 | 第59-63页 |
5.3 项目信息预处理子系统的实现 | 第63-66页 |
5.3.1 基础信息导入 | 第63-65页 |
5.3.2 项目内容导入 | 第65-66页 |
5.4 核心相似度计算端子系统的实现 | 第66-68页 |
5.4.1 线程调度器 | 第66页 |
5.4.2 核心计算模块 | 第66-67页 |
5.4.3 生成相似性检测结果集 | 第67-68页 |
5.5 项目相似度查询导出子系统的实现 | 第68-71页 |
5.5.1 用户登录 | 第68-69页 |
5.5.2 项目详细信息和全文信息展示 | 第69-71页 |
5.6 系统测试 | 第71-72页 |
5.6.1 系统测试环境 | 第71页 |
5.6.2 功能性测试目标 | 第71-72页 |
5.7 系统的性能测试 | 第72-75页 |
5.7.1 用户场景设计及测试结果 | 第72-73页 |
5.7.2 性能测试分析 | 第73-75页 |
5.8 本章小结 | 第75-76页 |
第六章 结论 | 第76-78页 |
6.1 工作总结 | 第76页 |
6.2 进一步的研究 | 第76-78页 |
致谢 | 第78-79页 |
参考文献 | 第79-83页 |