中文摘要 | 第1-3页 |
Abstract | 第3-4页 |
中文文摘 | 第4-6页 |
目录 | 第6-9页 |
第一章 绪论 | 第9-19页 |
·立题依据 | 第9-10页 |
·论文的主要内容与组织安排 | 第10-11页 |
·相似性度量方法概述 | 第11-19页 |
·相似度的定义 | 第11页 |
·基本数据类型 | 第11-12页 |
·常见的距离度量方式 | 第12-14页 |
·距离度量方式的发展 | 第14-17页 |
·小结 | 第17-19页 |
第二章 基于空间覆盖的相似性度量及其对应的分类算法 | 第19-35页 |
·分类算法概述 | 第19-20页 |
·基于部分覆盖的分类算法(PCC) | 第20-26页 |
·PCC算法简介 | 第20-21页 |
·定义及符号 | 第21-23页 |
·PCC算法的基本思路与流程 | 第23-24页 |
·PCC算法的图解范例 | 第24-26页 |
·PCC算法的优势 | 第26页 |
·实验及评估 | 第26-30页 |
·实验环境 | 第26-27页 |
·性能评估 | 第27-30页 |
·结论 | 第30页 |
·PCC算法在毒性物质预测领域的应用 | 第30-35页 |
·毒性物质数据集 | 第31页 |
·毒性物质分类实验 | 第31-35页 |
第三章 基于空间覆盖的相似性度量在特征选择中的应用 | 第35-45页 |
·特征选择概述 | 第35-38页 |
·基于空间覆盖的特征选择算法 DPC | 第38-45页 |
·DPC算法简介 | 第38页 |
·DPC算法的基本思路 | 第38-40页 |
·DPC算法的基本流程 | 第40-41页 |
·DPC算法的实验及评估 | 第41-43页 |
·结论 | 第43-45页 |
第四章 邻近集相似性理论及其发展应用 | 第45-61页 |
·NCM简介 | 第45页 |
·邻近区域的基本概念 | 第45-47页 |
·基于时间权重的邻近集算法TWNCM | 第47-50页 |
·时间序列相似性度量概述 | 第48-50页 |
·多维时间序列空间中的邻近关系 | 第50-56页 |
·与时间关联的邻近区域 | 第51页 |
·与空间关联的邻近区域 | 第51-52页 |
·邻近区域范例 | 第52-53页 |
·邻近区域的计算 | 第53-54页 |
·特殊情况:一维时间序列 | 第54-55页 |
·TWNCM相似性度量范例一 | 第55页 |
·NCM相似性度量的通用化公式 | 第55-56页 |
·TWNCM相似性度量范例二 | 第56页 |
·股票数据预测 | 第56-59页 |
·实验设置 | 第56-57页 |
·实验结果 | 第57-59页 |
·结论 | 第59-61页 |
第五章 基于页面结构相似性度量的WEB页面聚类及其在信息抽取中的应用 | 第61-73页 |
·WEB信息抽取技术的发展现状 | 第61-62页 |
·有序树的匹配模型和相似性度量 | 第62-67页 |
·Web页面的树描述 | 第62-63页 |
·编辑距离的概念 | 第63页 |
·树的编辑脚本和编辑代价 | 第63-64页 |
·有序树的LCS算法 | 第64-65页 |
·编辑操作 | 第65-66页 |
·编辑脚本的化简 | 第66-67页 |
·页面结构的模糊聚类 | 第67-68页 |
·按编辑代价构建模糊相似矩阵 | 第67页 |
·根据模糊相似矩阵进行模糊聚类 | 第67-68页 |
·归约与抽取 | 第68-70页 |
·生成归约树 | 第68-69页 |
·数据抽取 | 第69-70页 |
·实验分析 | 第70-71页 |
·小结 | 第71-73页 |
第六章 结语与展望 | 第73-75页 |
参考文献 | 第75-83页 |
攻读学位期间承担的科研任务与主要成果 | 第83-85页 |
致谢 | 第85-87页 |
个人简历 | 第87-88页 |