目录 | 第1-8页 |
TABLE OF CONTENTS | 第8-11页 |
摘要 | 第11-14页 |
ABSTRACT | 第14-18页 |
第1章 绪论 | 第18-34页 |
·研究背景与意义 | 第18-19页 |
·研究现状 | 第19-29页 |
·Web Spam分类 | 第19-25页 |
·Web Spam检测方法 | 第25-29页 |
·存在的问题和挑战 | 第29-31页 |
·本文主要研究内容和创新点 | 第31-32页 |
·本文的组织结构 | 第32-34页 |
第2章 相关知识及研究 | 第34-46页 |
·遗传规划 | 第34页 |
·集成学习 | 第34-35页 |
·非平衡数据集分类问题 | 第35-36页 |
·评价标准 | 第36-39页 |
·WEBSPAM-UK2006数据集 | 第39-45页 |
·数据的抓取、存储和下载 | 第40页 |
·数据的标注 | 第40-42页 |
·特征集合 | 第42-45页 |
·本章小结 | 第45-46页 |
第3章 基于遗传规划学习判别函数检测Web Spam | 第46-57页 |
·引言 | 第46-47页 |
·个体表示和适应函数的定义 | 第47-48页 |
·种群的产生方法 | 第48-49页 |
·遗传操作 | 第49-50页 |
·多种群遗传规划和组合 | 第50-51页 |
·算法描述 | 第51-53页 |
·实验 | 第53-56页 |
·数据集和评价标准 | 第53页 |
·遗传规划相关参数设置 | 第53-54页 |
·实验结果和分析 | 第54-56页 |
·本章小结 | 第56-57页 |
第4章 利用基于遗传规划的集成学习检测Web Spam | 第57-81页 |
·引言 | 第57-58页 |
·遗传规划集成学习的处理流程 | 第58-59页 |
·多样基分类器的构造 | 第59-60页 |
·利用遗传规划进行集成的基本原理 | 第60-61页 |
·遗传规划集成学习的相关设置 | 第61-63页 |
·算法描述 | 第63-66页 |
·实验 | 第66-80页 |
·对比算法介绍 | 第66-68页 |
·平衡数据集上的实验 | 第68-76页 |
·非平衡数据集上的实验 | 第76-80页 |
·本章小结 | 第80-81页 |
第5章 基于遗传规划产生新特征检测Web Spam | 第81-87页 |
·引言 | 第81页 |
·相关内容 | 第81-82页 |
·算法描述 | 第82-83页 |
·实验 | 第83-86页 |
·数据集和评价指标 | 第83页 |
·实验结果 | 第83-86页 |
·本章小结 | 第86-87页 |
第6章 总结与展望 | 第87-90页 |
·主要工作总结 | 第87-88页 |
·未来工作展望 | 第88-90页 |
参考文献 | 第90-101页 |
致谢 | 第101-102页 |
攻读学位期间发表的学术论文目录 | 第102-104页 |
攻读学位期间参与科研项目情况 | 第104-105页 |
攻读学位期间获奖情况 | 第105-106页 |
学位论文评阅及答辩情况表 | 第106-108页 |
外文论文 | 第108-130页 |