首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

相似性度量的研究及其在数据挖掘中的应用

中文摘要第1-3页
Abstract第3-4页
中文文摘第4-6页
目录第6-9页
第一章 绪论第9-19页
   ·立题依据第9-10页
   ·论文的主要内容与组织安排第10-11页
   ·相似性度量方法概述第11-19页
     ·相似度的定义第11页
     ·基本数据类型第11-12页
     ·常见的距离度量方式第12-14页
     ·距离度量方式的发展第14-17页
     ·小结第17-19页
第二章 基于空间覆盖的相似性度量及其对应的分类算法第19-35页
   ·分类算法概述第19-20页
   ·基于部分覆盖的分类算法(PCC)第20-26页
     ·PCC算法简介第20-21页
     ·定义及符号第21-23页
     ·PCC算法的基本思路与流程第23-24页
     ·PCC算法的图解范例第24-26页
     ·PCC算法的优势第26页
   ·实验及评估第26-30页
     ·实验环境第26-27页
     ·性能评估第27-30页
   ·结论第30页
   ·PCC算法在毒性物质预测领域的应用第30-35页
     ·毒性物质数据集第31页
     ·毒性物质分类实验第31-35页
第三章 基于空间覆盖的相似性度量在特征选择中的应用第35-45页
   ·特征选择概述第35-38页
   ·基于空间覆盖的特征选择算法 DPC第38-45页
     ·DPC算法简介第38页
     ·DPC算法的基本思路第38-40页
     ·DPC算法的基本流程第40-41页
     ·DPC算法的实验及评估第41-43页
     ·结论第43-45页
第四章 邻近集相似性理论及其发展应用第45-61页
   ·NCM简介第45页
   ·邻近区域的基本概念第45-47页
   ·基于时间权重的邻近集算法TWNCM第47-50页
     ·时间序列相似性度量概述第48-50页
   ·多维时间序列空间中的邻近关系第50-56页
     ·与时间关联的邻近区域第51页
     ·与空间关联的邻近区域第51-52页
     ·邻近区域范例第52-53页
     ·邻近区域的计算第53-54页
     ·特殊情况:一维时间序列第54-55页
     ·TWNCM相似性度量范例一第55页
     ·NCM相似性度量的通用化公式第55-56页
     ·TWNCM相似性度量范例二第56页
   ·股票数据预测第56-59页
     ·实验设置第56-57页
     ·实验结果第57-59页
   ·结论第59-61页
第五章 基于页面结构相似性度量的WEB页面聚类及其在信息抽取中的应用第61-73页
   ·WEB信息抽取技术的发展现状第61-62页
   ·有序树的匹配模型和相似性度量第62-67页
     ·Web页面的树描述第62-63页
     ·编辑距离的概念第63页
     ·树的编辑脚本和编辑代价第63-64页
     ·有序树的LCS算法第64-65页
     ·编辑操作第65-66页
     ·编辑脚本的化简第66-67页
   ·页面结构的模糊聚类第67-68页
     ·按编辑代价构建模糊相似矩阵第67页
     ·根据模糊相似矩阵进行模糊聚类第67-68页
   ·归约与抽取第68-70页
     ·生成归约树第68-69页
     ·数据抽取第69-70页
   ·实验分析第70-71页
   ·小结第71-73页
第六章 结语与展望第73-75页
参考文献第75-83页
攻读学位期间承担的科研任务与主要成果第83-85页
致谢第85-87页
个人简历第87-88页

论文共88页,点击 下载论文
上一篇:图书馆数字资源长期保存与管理研究
下一篇:图书馆2.0环境下的数字资源整合生态研究