首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

面向移动搜索的WAP页面消重技术研究

致谢第1-6页
摘要第6-7页
ABSTRACT第7-10页
1 引言第10-13页
   ·研究背景及意义第10-11页
   ·本文的主要工作第11-12页
   ·论文的组织结构第12-13页
2 WAP页面消重框架第13-26页
   ·WAP页面特性第13-17页
     ·页面的类型第13-15页
     ·重复WAP页面的定义第15-17页
   ·消重框架流程第17-25页
     ·DOM解析第17-18页
     ·VIPS识别第18-20页
     ·页面分类第20-22页
     ·标题正文提取第22-25页
   ·本章小结第25-26页
3 面向WAP页面的特征提取方法第26-39页
   ·现有特征提取方法第26-29页
     ·基于整个文档的特征提取方法第26-27页
     ·基于Shingle的特征提取方法第27-29页
     ·基于词(term/phrase)的特征提取方法第29页
   ·WAP页面驱动的特征提取第29-38页
     ·面向内容页的特征提取方法第31页
     ·面向下载页的特征提取方法第31-34页
     ·面向导航页的特征提取方法第34-35页
     ·面向图片页的特征提取方法第35-36页
     ·面向BBS页的特征提取方法第36-38页
   ·本章小结第38-39页
4 基于SimHash消重技术的研究与应用第39-49页
   ·现有的消重技术第39-44页
     ·基于Shingle的消重技术第40-42页
     ·基于Bloom Filter的消重技术第42-44页
     ·基于SimHash的网页消重技术第44页
   ·面向WAP页面消重方法第44-48页
     ·算法详细描述第45-48页
   ·本章小结第48-49页
5 实验及分析第49-57页
   ·WAP页面消重评价方法第49-50页
     ·现有评价方法第49页
     ·本文设计的评价方法第49-50页
   ·实验数据第50-51页
   ·实验设计第51页
   ·实验结果及分析第51-56页
     ·实验结果第52-55页
     ·实验分析第55-56页
   ·本章小结第56-57页
6 总结与展望第57-59页
   ·全文总结第57-58页
   ·下一步工作展望第58-59页
参考文献第59-62页
作者简历第62-64页
学位论文数据集第64页

论文共64页,点击 下载论文
上一篇:密罐系统的研究与实现
下一篇:基于Snort的入侵检测系统的研究与实现