| 中文摘要 | 第1-3页 |
| Abstract | 第3-4页 |
| 中文文摘 | 第4-6页 |
| 目录 | 第6-9页 |
| 第一章 绪论 | 第9-19页 |
| ·立题依据 | 第9-10页 |
| ·论文的主要内容与组织安排 | 第10-11页 |
| ·相似性度量方法概述 | 第11-19页 |
| ·相似度的定义 | 第11页 |
| ·基本数据类型 | 第11-12页 |
| ·常见的距离度量方式 | 第12-14页 |
| ·距离度量方式的发展 | 第14-17页 |
| ·小结 | 第17-19页 |
| 第二章 基于空间覆盖的相似性度量及其对应的分类算法 | 第19-35页 |
| ·分类算法概述 | 第19-20页 |
| ·基于部分覆盖的分类算法(PCC) | 第20-26页 |
| ·PCC算法简介 | 第20-21页 |
| ·定义及符号 | 第21-23页 |
| ·PCC算法的基本思路与流程 | 第23-24页 |
| ·PCC算法的图解范例 | 第24-26页 |
| ·PCC算法的优势 | 第26页 |
| ·实验及评估 | 第26-30页 |
| ·实验环境 | 第26-27页 |
| ·性能评估 | 第27-30页 |
| ·结论 | 第30页 |
| ·PCC算法在毒性物质预测领域的应用 | 第30-35页 |
| ·毒性物质数据集 | 第31页 |
| ·毒性物质分类实验 | 第31-35页 |
| 第三章 基于空间覆盖的相似性度量在特征选择中的应用 | 第35-45页 |
| ·特征选择概述 | 第35-38页 |
| ·基于空间覆盖的特征选择算法 DPC | 第38-45页 |
| ·DPC算法简介 | 第38页 |
| ·DPC算法的基本思路 | 第38-40页 |
| ·DPC算法的基本流程 | 第40-41页 |
| ·DPC算法的实验及评估 | 第41-43页 |
| ·结论 | 第43-45页 |
| 第四章 邻近集相似性理论及其发展应用 | 第45-61页 |
| ·NCM简介 | 第45页 |
| ·邻近区域的基本概念 | 第45-47页 |
| ·基于时间权重的邻近集算法TWNCM | 第47-50页 |
| ·时间序列相似性度量概述 | 第48-50页 |
| ·多维时间序列空间中的邻近关系 | 第50-56页 |
| ·与时间关联的邻近区域 | 第51页 |
| ·与空间关联的邻近区域 | 第51-52页 |
| ·邻近区域范例 | 第52-53页 |
| ·邻近区域的计算 | 第53-54页 |
| ·特殊情况:一维时间序列 | 第54-55页 |
| ·TWNCM相似性度量范例一 | 第55页 |
| ·NCM相似性度量的通用化公式 | 第55-56页 |
| ·TWNCM相似性度量范例二 | 第56页 |
| ·股票数据预测 | 第56-59页 |
| ·实验设置 | 第56-57页 |
| ·实验结果 | 第57-59页 |
| ·结论 | 第59-61页 |
| 第五章 基于页面结构相似性度量的WEB页面聚类及其在信息抽取中的应用 | 第61-73页 |
| ·WEB信息抽取技术的发展现状 | 第61-62页 |
| ·有序树的匹配模型和相似性度量 | 第62-67页 |
| ·Web页面的树描述 | 第62-63页 |
| ·编辑距离的概念 | 第63页 |
| ·树的编辑脚本和编辑代价 | 第63-64页 |
| ·有序树的LCS算法 | 第64-65页 |
| ·编辑操作 | 第65-66页 |
| ·编辑脚本的化简 | 第66-67页 |
| ·页面结构的模糊聚类 | 第67-68页 |
| ·按编辑代价构建模糊相似矩阵 | 第67页 |
| ·根据模糊相似矩阵进行模糊聚类 | 第67-68页 |
| ·归约与抽取 | 第68-70页 |
| ·生成归约树 | 第68-69页 |
| ·数据抽取 | 第69-70页 |
| ·实验分析 | 第70-71页 |
| ·小结 | 第71-73页 |
| 第六章 结语与展望 | 第73-75页 |
| 参考文献 | 第75-83页 |
| 攻读学位期间承担的科研任务与主要成果 | 第83-85页 |
| 致谢 | 第85-87页 |
| 个人简历 | 第87-88页 |