首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

不同类型数据间的聚类算法

摘要第1-7页
Abstract第7-8页
第1章 引言第8-12页
   ·数据多样性第8-9页
   ·数据预处理第9页
   ·聚类第9-10页
   ·应用场景第10页
   ·作者的工作和论文的结构第10-12页
第2章 网页去杂第12-27页
   ·相关工作第12-13页
   ·模板的定义第13-17页
   ·寻找模板第17-24页
     ·处理HTML标记第17-18页
     ·寻找模板块第18-19页
     ·寻找块模板第19-24页
   ·删除模板第24-27页
     ·删除HTML标记第24页
     ·删除模板第24-27页
第3章 网页去重第27-37页
   ·相关工作第28-29页
   ·提取特征第29-30页
   ·对网页重复的定义第30-31页
   ·寻找重复网页第31-36页
     ·Bloom Filter第32-35页
     ·寻找重复网页第35-36页
   ·分词第36-37页
第4章 K-means算法第37-43页
   ·K-means第37-38页
   ·距离的计算第38-41页
   ·质心的选择第41页
     ·初始质心第41页
   ·空间,时间复杂度分析第41-43页
第5章 关联性分析第43-55页
   ·问题抽象第43-44页
   ·关联性规则第44-46页
   ·寻找高频消费集第46-51页
     ·先验原理(Apriori principle)第46-50页
     ·查询消费集第50-51页
   ·寻找关联性规则第51-53页
   ·聚类整合第53-55页
     ·类的关键词第53-54页
     ·聚类整合第54-55页
第6章 实验结果第55-58页
   ·网页去杂与网页去重实验第55-56页
   ·聚类实验第56-58页
第7章 总结与展望第58-60页
   ·总结第58页
   ·展望第58-60页
参考文献第60-62页
攻读硕士期间发表的论文和参与的科研项目第62-63页
致谢第63-64页

论文共64页,点击 下载论文
上一篇:基于词关联度的信息检索系统
下一篇:基于本体的医疗知识管理系统开发