首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于内容的不良网页信息过滤方法研究

提要第1-5页
摘要第5-6页
Abstract第6-11页
第1章 绪论第11-16页
   ·研究背景和意义第11-12页
   ·网络信息过滤技术的分类及简介第12-13页
     ·基于网页地址(URL)的过滤第12页
     ·基于网页内容的过滤第12-13页
   ·文本过滤技术的发展及现状第13-14页
   ·论文的主要工作和组织结构第14-16页
     ·论文的主要工作第14-15页
     ·论文组织结构第15-16页
第2章 基于文本内容的网页信息过滤第16-23页
   ·网页信息的传输和 HTML 文档标签加权第16-18页
   ·网页分类的概念第18-19页
   ·网页文本过滤流程第19-21页
   ·系统评价指标第21-23页
第3章 特征选择和权值计算第23-37页
   ·文本的向量表示第23页
   ·文本的特征选择第23-27页
     ·文档频度第24页
     ·χ~2统计量第24-25页
     ·信息增益第25页
     ·互信息第25-26页
     ·期望交叉熵第26页
     ·文本证据权第26-27页
     ·特征选择方法对比第27页
   ·文本的特征构建流程第27-33页
     ·χ~2统计特征选择第28页
     ·生成文本索引矩阵第28-29页
     ·特征词共现矩阵第29-31页
     ·简化的 DBSCAN 算法特征聚类选择第31-33页
     ·文本特征表示第33页
   ·特征簇权值计算第33-36页
     ·加入类别因子的TF-IDF权重计算第34-35页
     ·基于簇的文档向量权值计算第35-36页
   ·本章小结第36-37页
第4章 基于贝叶斯和支持向量机的双层过滤方法第37-52页
   ·常用文本分类方法介绍第37-39页
     ·KNN 算法第37-38页
     ·朴素贝叶斯方法第38-39页
     ·支持向量机方法第39页
   ·双层过滤分类方法设计原理第39-41页
   ·双层过滤器设计实现第41-50页
     ·第一层朴素贝叶斯过滤第42-44页
     ·第二层 SVM 过滤第44-50页
   ·特征簇自学习更新第50-51页
   ·本章小结第51-52页
第5章 实验结果与总结第52-58页
   ·实验方案第52页
   ·实验评价指标第52页
   ·第一层过滤参数选择第52-53页
   ·实验结果第53-56页
   ·结果分析第56页
   ·总结与展望第56-58页
参考文献第58-60页
致谢第60页

论文共60页,点击 下载论文
上一篇:基于xPC Target的数据采集系统开发
下一篇:结构光光线的标定技术