首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

面向网页去重的特征提取与重复模式发现

摘要第1-6页
Abstract第6-9页
第1章 绪论第9-14页
   ·课题来源及意义第9页
   ·应用背景介绍第9-11页
     ·搜索引擎第9-11页
     ·自然语言处理第11页
   ·论文研究内容第11-12页
   ·论文组织结构第12-14页
第2章 网页去重相关技术研究现状第14-25页
   ·引言第14页
   ·特征提取技术第14-21页
     ·基于规则的提取技术第15-17页
     ·基于权重的提取技术第17-21页
   ·重复模式发现技术第21-24页
   ·网页去重技术发展趋势第24页
   ·本章小结第24-25页
第3章 基于层次筛选的网页特征提取算法第25-38页
   ·引言第25页
   ·算法总体思路第25-27页
   ·算法细节描述第27-33页
     ·段落筛选与去噪第27-28页
     ·句子筛选第28-31页
     ·特征词筛选第31-33页
   ·实验结果与分析第33-37页
     ·实验步骤第33-34页
     ·实验结果第34-36页
     ·实验对比分析第36-37页
   ·本章小结第37-38页
第4章 基于改进LCS的重复模式发现算法第38-53页
   ·引言第38页
   ·LCS算法研究与改进第38-43页
     ·LCS算法的实现与缺陷第38-40页
     ·LCS算法改进第40-43页
   ·基于改进LCS的重复模式发现第43-48页
     ·文本表示与重复定义第43-45页
     ·方案设计与实现第45-48页
   ·实验结果与分析第48-52页
     ·实验步骤第48-49页
     ·实验结果第49-51页
     ·实验对比分析第51-52页
   ·本章小结第52-53页
结论第53-54页
参考文献第54-57页
攻读硕士学位期间发表的论文和取得的科研成果第57-58页
致谢第58页

论文共58页,点击 下载论文
上一篇:基于网络编码的P2P内容分发机制研究
下一篇:网络安全事件聚合与关联分析技术研究