基于内容的不良网页信息过滤方法研究

提要	第1-5页
摘要	第5-6页
Abstract	第6-11页
第1章绪论	第11-16页
·研究背景和意义	第11-12页
·网络信息过滤技术的分类及简介	第12-13页
·基于网页地址（URL）的过滤	第12页
·基于网页内容的过滤	第12-13页
·文本过滤技术的发展及现状	第13-14页
·论文的主要工作和组织结构	第14-16页
·论文的主要工作	第14-15页
·论文组织结构	第15-16页
第2章基于文本内容的网页信息过滤	第16-23页
·网页信息的传输和 HTML 文档标签加权	第16-18页
·网页分类的概念	第18-19页
·网页文本过滤流程	第19-21页
·系统评价指标	第21-23页
第3章特征选择和权值计算	第23-37页
·文本的向量表示	第23页
·文本的特征选择	第23-27页
·文档频度	第24页
·χ~2统计量	第24-25页
·信息增益	第25页
·互信息	第25-26页
·期望交叉熵	第26页
·文本证据权	第26-27页
·特征选择方法对比	第27页
·文本的特征构建流程	第27-33页
·χ~2统计特征选择	第28页
·生成文本索引矩阵	第28-29页
·特征词共现矩阵	第29-31页
·简化的 DBSCAN 算法特征聚类选择	第31-33页
·文本特征表示	第33页
·特征簇权值计算	第33-36页
·加入类别因子的TF-IDF权重计算	第34-35页
·基于簇的文档向量权值计算	第35-36页
·本章小结	第36-37页
第4章基于贝叶斯和支持向量机的双层过滤方法	第37-52页
·常用文本分类方法介绍	第37-39页
·KNN 算法	第37-38页
·朴素贝叶斯方法	第38-39页
·支持向量机方法	第39页
·双层过滤分类方法设计原理	第39-41页
·双层过滤器设计实现	第41-50页
·第一层朴素贝叶斯过滤	第42-44页
·第二层 SVM 过滤	第44-50页
·特征簇自学习更新	第50-51页
·本章小结	第51-52页
第5章实验结果与总结	第52-58页
·实验方案	第52页
·实验评价指标	第52页
·第一层过滤参数选择	第52-53页
·实验结果	第53-56页
·结果分析	第56页
·总结与展望	第56-58页
参考文献	第58-60页
致谢	第60页