摘要 | 第6-7页 |
Abstract | 第7-8页 |
第1章 绪论 | 第11-17页 |
1.1 研究背景和意义 | 第11-12页 |
1.2 国内外研究现状 | 第12-15页 |
1.2.1 垃圾网页检测 | 第12-14页 |
1.2.2 代价敏感学习 | 第14-15页 |
1.3 研究内容和目标 | 第15-16页 |
1.4 论文结构安排 | 第16-17页 |
第2章 垃圾网页检测与代价敏感学习相关技术 | 第17-27页 |
2.1 常见垃圾网页欺诈行为分析 | 第17-21页 |
2.1.1 基于欺骗搜索引擎行为的垃圾网页 | 第17-20页 |
2.1.2 基于干扰用户行为的垃圾网页 | 第20页 |
2.1.3 基于欺骗用户行为的垃圾网页 | 第20-21页 |
2.2 常用垃圾网页欺诈检测方法 | 第21-24页 |
2.2.1 基于图片识别过滤方法 | 第22页 |
2.2.2 基于Web图模型评分排序算法 | 第22-23页 |
2.2.3 基于机器学习分类算法 | 第23-24页 |
2.3 代价敏感学习相关定义与方法 | 第24-26页 |
2.3.1 代价类型定义 | 第24-25页 |
2.3.2 代价敏感分类与不平衡数据集问题 | 第25页 |
2.3.3 常用代价敏感分类方法 | 第25-26页 |
2.4 本章小结 | 第26-27页 |
第3章 基于代价敏感分类的垃圾网页检测 | 第27-36页 |
3.1 代价敏感支持向量机 | 第27-31页 |
3.1.1 二元分类误分类代价矩阵 | 第27-28页 |
3.1.2 支持向量机算法 | 第28-30页 |
3.1.3 支持向量机代价敏感化 | 第30-31页 |
3.2 误分类代价的客观确定 | 第31-35页 |
3.2.1 粒子群优化算法 | 第31-33页 |
3.2.2 融合误分类代价计算的垃圾网页检测 | 第33-34页 |
3.2.3 代价矩阵计算化简 | 第34-35页 |
3.3 本章小结 | 第35-36页 |
第4章 代价敏感多级垃圾网页检测 | 第36-44页 |
4.1 多级检测及其代价矩阵 | 第36-37页 |
4.2 基于CSSVM的多元分类方法 | 第37-40页 |
4.2.1 多分类实现方法 | 第37-39页 |
4.2.2 多分类方法选择与代价融合问题 | 第39-40页 |
4.3 基于矩阵拆分的多类误分代价确定与计算化简 | 第40-43页 |
4.4 本章小结 | 第43-44页 |
第5章 实验结果与分析 | 第44-59页 |
5.1 实验准备与评价指标 | 第44-49页 |
5.1.1 实验数据集 | 第44-45页 |
5.1.2 评价指标 | 第45-47页 |
5.1.3 特征筛选 | 第47-49页 |
5.2 基于代价敏感分类的垃圾网页检测实验 | 第49-54页 |
5.2.1 实验一 基于融合误分类代价计算的垃圾网页二元分类检测框架 | 第49-52页 |
5.2.2 实验二 基于数据采样的代价敏感二元分类检测结果 | 第52-53页 |
5.2.3 代价敏感二元分类方法性能比较 | 第53-54页 |
5.3 代价敏感多级垃圾网页检测实验 | 第54-58页 |
5.3.1 实验一 基于融合误分类代价计算的多级垃圾网页检测框架 | 第54-56页 |
5.3.2 实验二 基于数据采样的代价敏感多元分类检测结果 | 第56-57页 |
5.3.3 代价敏感多元分类方法性能比较 | 第57-58页 |
5.4 本章小结 | 第58-59页 |
总结与展望 | 第59-61页 |
总结 | 第59页 |
展望 | 第59-61页 |
致谢 | 第61-62页 |
参考文献 | 第62-66页 |
攻读硕士学位期间发表的论文 | 第66页 |