网络文本主动检测分析系统

摘要	第1-4页
Abstract	第4-7页
第一章引言	第7-10页
·Internet的发展	第7页
·网络信息安全领域面临的挑战	第7-9页
·网络信息内容识别和控制的必要性	第9-10页
第二章现有文本分类技术介绍	第10-17页
·文本的表示	第10-11页
·特征项的提取	第11-12页
·常用分类器	第12-15页
·最小距离分类器	第12-13页
·k近邻分类器	第13页
·Bayes分类器	第13页
·SVM分类器	第13-15页
·分类性能衡量	第15页
·分类的总体过程	第15-16页
·现有文本分类技术在网络信息安全应用的不足	第16-17页
第三章系统的总体设计	第17-19页
·系统实现的目的及意义	第17页
·系统总体框架设计	第17-19页
·文本内容提取模块	第18页
·文本训练模块	第18页
·分类决策模块	第18页
·动态更新模块	第18-19页
·实现系统需要的关键技术	第19页
第四章系统实现的关键技术	第19-38页
·相关的中文信息处理技术	第19-23页
·汉字的编码简介	第19-21页
·汉语的切词	第21-23页
·统计词库	第23页
·快速重复串统计算法	第23-25页
·问题提出的背景	第23-24页
·问题的抽象	第24页
·算法思想	第24-25页
·性能分析	第25页
·红黑树快速查找算法	第25-33页
·问题的提出	第25-26页
·查找算法及数据结构选取	第26页
·红黑树的定义以及效率探讨	第26-28页
·红黑树、二叉搜索树、平衡二叉树、B树的比较	第28-30页
·实际操作:红黑树的生成、插入、删除、检索	第30-33页
·朴素贝叶斯文本分类器(Native Bayes)	第33-34页
·最大化熵模型分类器(Maximum Entropy)	第34-36页
·特征值的选取及类属性计算	第36-38页
·特征值的选取	第36页
·类属性值的计算	第36-38页
第五章系统程序设计与程序实现	第38-48页
·系统程序总体设计	第38页
·文本内容提取模块	第38-44页
·MIME简介	第38页
·MIME文件组成	第38-39页
·邮件头和段头中一些常见的域	第39-40页
·Content-Type以及参数形式	第40-41页
·编码方式Content-Transfer-Encoding	第41页
·内嵌资源	第41-43页
·MIME分析程序实现	第43-44页
·文本训练模块	第44-45页
·决策分类模块	第45-46页
·动态更新(在线学习)模块	第46页
·系统实现的结果	第46-48页
·初步测试结果	第47-48页
第六章结论与展望	第48-50页
·进一步的工作	第48-49页
·展望	第49-50页
攻读硕士学位期间取得的学术成果	第50-51页
致谢	第51-52页
参考文献	第52-53页