基于网络信息审计的文本过滤的研究与实现

中文摘要	第1-5页
Abstract	第5-10页
第一章引言	第10-17页
·课题背景	第10-11页
·研究意义	第11-12页
·研究现状	第12-15页
·国外研究现状	第12-13页
·国内研究现状	第13-14页
·文本过滤系统发展状况	第14-15页
·本文研究工作	第15-16页
·论文结构	第16-17页
第二章相关研究工作	第17-29页
·网络信息审计技术	第17页
·文本过滤技术	第17-18页
·特征选择	第18-21页
·文档频度	第19页
·互信息	第19-20页
·信息增益	第20页
·卡方检验	第20-21页
·文本表示模型	第21-23页
·布尔模型	第21-22页
·概率模型	第22页
·向量空间模型	第22-23页
·文本分类方法	第23-26页
·朴素贝叶斯	第24页
·K 最近邻	第24页
·支持向量机	第24-25页
·神经网络	第25-26页
·决策树	第26页
·网页文本过滤的特有方法	第26-28页
·本章小结	第28-29页
第三章基于IP Queue 的实时网页文本过滤	第29-43页
·实时网页文本过滤概述	第29-32页
·过滤流程	第29-30页
·模块初始化	第30-31页
·关键的数据结构	第31-32页
·请求报文过滤模块	第32-34页
·建立黑白名单	第32页
·建立Hash 连接结点	第32-33页
·处理HTTP 压缩	第33页
·IP 和 URL 过滤	第33-34页
·响应报文过滤模块	第34-37页
·报文预判断	第34-35页
·第一个响应报文的处理	第35页
·字符编码转化	第35页
·屏蔽非法关键词	第35-37页
·Hash 表	第37-38页
·结点的建立	第37页
·结点的维护	第37-38页
·结点的删除	第38页
·实验结果及其分析	第38-41页
·实时性能的实验	第38-40页
·关键词屏蔽效果	第40-41页
·本章小结	第41-43页
第四章基于二元模型的文本过滤	第43-54页
·基于二元模型的文本过滤概述	第43-45页
·网页预处理和文本分词	第45-46页
·基于关键词的第一层过滤	第46-47页
·基于二元词串的第二层过滤	第47-48页
·二元词串的提取	第47-48页
·基于SVM 的过滤	第48页
·相关实验及其结果分析	第48-53页
·实验数据	第48页
·非法关键词的抽取策略	第48-49页
·非法关键词集合大小及其过滤阀值的实验	第49-50页
·文本过滤实验	第50页
·特征数目的实验	第50-51页
·不同过滤方法的对比实验	第51-53页
·本章小结	第53-54页
第五章网页文本过滤系统整体设计与实现	第54-59页
·系统部署环境	第54-55页
·系统工作流程	第55-56页
·综合实验及其结果分析	第56-58页
·本章小结	第58-59页
第六章总结与展望	第59-61页
·总结	第59-60页
·展望	第60-61页
参考文献	第61-65页
攻读学位期间公开发表的论文	第65-66页
致谢	第66-67页