首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

网页相似性算法的研究与实现

第一章 绪论第1-12页
   ·问题陈述第7页
   ·相似网页检测所面临的技术挑战第7-11页
   ·本文所做的工作第11-12页
第二章 网页过滤和净化第12-19页
   ·网页净化的必要性第12页
   ·网页净化方法和算法第12-17页
     ·网页内容块净化方法第13-15页
     ·一种简单的正文信息提取方法第15-17页
   ·网页净化的效果第17-19页
第三章 分类和快速聚类第19-27页
   ·分类第19-25页
     ·文本的表示第19-20页
     ·特征项的抽取第20-21页
     ·训练方法与分类算法第21-25页
     ·分类系统的结构框架第25页
   ·快速聚类第25-27页
第四章 相似性度量算法第27-49页
   ·相似性检测的几个问题第27-29页
     ·基于关键词匹配的搜索引擎系统及文档的向量空间表示第27-29页
   ·相似检测的文本特征问题第29-36页
     ·特征提取方式第29-30页
     ·基于字符串比较的方法第30页
     ·基于词频统计的方法第30-33页
     ·基于关键词摘要的方法第33-36页
   ·文本块问题第36-37页
   ·指纹算法第37-43页
     ·HASH 函数第37-39页
     ·指纹的选取第39-43页
   ·网页相似检测算法第43-49页
第五章 算法的实现及实验结果第49-53页
   ·系统实现第49-50页
   ·实验结果第50-52页
   ·算法的局限性和可能的改进第52-53页
第六章 结束语第53-54页
参考文献第54-56页
论文摘要第56-58页
ABSTRACT第58-60页
致谢第60-61页
导师及作者简介第61页

论文共61页,点击 下载论文
上一篇:复杂化学数据的知识发现新型化学计量学算法研究
下一篇:基于目标角闪烁特性的末制导雷达跟踪与识别技术