隐藏型垃圾网页检测研究
摘要 | 第1-7页 |
Abstract | 第7-10页 |
第1章 绪论 | 第10-15页 |
·研究背景和意义 | 第10-11页 |
·国内外研究现状 | 第11-13页 |
·重定向检测的研究现状 | 第11-12页 |
·伪装型垃圾网页检测研究现状 | 第12-13页 |
·本文的主要研究内容 | 第13页 |
·论文的结构安排 | 第13-14页 |
·本章小结 | 第14-15页 |
第2章 隐藏型垃圾网页检测技术 | 第15-22页 |
·隐藏型垃圾网页欺诈技术 | 第15-16页 |
·内容隐藏 | 第15页 |
·重定向 | 第15-16页 |
·伪装 | 第16页 |
·隐藏型垃圾网页的相关检测技术 | 第16-21页 |
·重定向的相关检测技术 | 第16-18页 |
·伪装型垃圾网页的相关检测技术 | 第18-21页 |
·本章小结 | 第21-22页 |
第3章 伪装型垃圾网页检测算法设计 | 第22-35页 |
·Cloaking欺诈技术的现象和机理 | 第22-26页 |
·Cloaking检测算法设计 | 第26-32页 |
·原理分析 | 第26-28页 |
·具体设计 | 第28-32页 |
·朴素贝叶斯分类器 | 第32-34页 |
·本章小结 | 第34-35页 |
第4章 伪装型垃圾网页检测系统设计 | 第35-52页 |
·Cloaking检测系统需求 | 第35页 |
·Cloaking检测系统工作流程 | 第35-36页 |
·Cloaking检测系统数据集构建方法 | 第36-38页 |
·模拟搜索引擎爬虫方法 | 第36-38页 |
·搜索结果相关页面的获取 | 第38页 |
·网页特征信息提取 | 第38-43页 |
·特定标签提取 | 第39-40页 |
·内容特征 | 第40-42页 |
·链接特征 | 第42-43页 |
·Cloaking检测模块设计 | 第43页 |
·系统数据库设计 | 第43-48页 |
·系统的技术基础 | 第48-51页 |
·Jsoup | 第48-49页 |
·DOM | 第49-50页 |
·HtmlUnit | 第50-51页 |
·Rhino | 第51页 |
·本章小结 | 第51-52页 |
第5章 伪装型垃圾网页检测系统实现 | 第52-68页 |
·Cloaking检测系统数据集构建 | 第52-56页 |
·构建垃圾词汇库 | 第52-55页 |
·模拟搜索引擎爬虫及浏览器用户 | 第55页 |
·解析搜索结果页面及获取信息 | 第55-56页 |
·网页特征信息提取 | 第56-61页 |
·特定标签提取 | 第57-58页 |
·内容特征提取 | 第58-60页 |
·链接特征提取 | 第60-61页 |
·Cloaking垃圾网页检测 | 第61-66页 |
·Cloaking垃圾网页检测算法 | 第61-65页 |
·Cloaking垃圾网页检测流程 | 第65-66页 |
·文件管理 | 第66-67页 |
·本章小结 | 第67-68页 |
第6章 实验与结果分析 | 第68-76页 |
·实验数据集 | 第68页 |
·实验数据结果标注 | 第68-69页 |
·评价指标 | 第69-70页 |
·实验结果与分析 | 第70-75页 |
·混淆矩阵分析 | 第70-74页 |
·Cloaking类型分析 | 第74-75页 |
·本章小结 | 第75-76页 |
第7章 总结与展望 | 第76-77页 |
致谢 | 第77-78页 |
参考文献 | 第78-81页 |
攻读硕士学位期间发表的论文 | 第81页 |