网页关键字过滤研究及改进

摘要	第1-6页
ABSTRACT	第6-10页
第一章绪论	第10-15页
·研究背景及意义	第10-11页
·国内外研究现状	第11-13页
·本文的研究内容和结构安排	第13-14页
·本章小结	第14-15页
第二章网页文本关键字相关技术介绍	第15-26页
·目前主要的网页过滤方法	第15-18页
·网页内容分级法	第15-16页
·URL地址列表法	第16-17页
·文本分析法	第17页
·多媒体信息过滤技术	第17-18页
·动态跟踪技术	第18页
·网页关键字过滤的数学模型	第18-22页
·布尔模型(Boolean Model)	第18-19页
·向量模型(Vector Space Model)	第19-21页
·概率模型(Probobilistic Model)	第21-22页
·潜在语义索引模型(Latent Semantic Indexing Model)	第22页
·文本过滤系统性能的评价	第22-25页
·召回率、准确率	第23页
·F值	第23-24页
·Utility	第24页
·E值	第24-25页
·本章小结	第25-26页
第三章网页文本关键字过滤系统的总体设计	第26-30页
·系统功能要求	第27-28页
·系统运行环境	第28页
·系统工作流程	第28-29页
·本章小结	第29-30页
第四章数据捕获子系统	第30-40页
·TCP协议	第30-32页
·基于WinPcap的数据包包捕获	第32-37页
·数据包捕获原理	第32页
·基于Windows平台的数据包捕获实现	第32-37页
·数据重组	第37-39页
·本章小结	第39-40页
第五章网页文本关键字过滤子系统	第40-51页
·文本预处理	第41-44页
·无关信息过滤	第41-42页
·含有特殊符号的敏感词处理	第42页
·含有拼音的敏感词处理	第42-43页
·含有偏旁部首的敏感字的处理	第43页
·其他形式	第43-44页
·高频词的提取	第44-45页
·中文分词	第45-48页
·正向最大匹配法	第46-47页
·逆向最大匹配法	第47页
·双向最大匹配法	第47-48页
·最少切分法	第48页
·字典的扩充	第48-49页
·权值算法的改进	第49-50页
·本章小结	第50-51页
第六章实验结果分析	第51-56页
第七章总结与展望	第56-58页
·总结	第56-57页
·展望	第57-58页
参考文献	第58-62页
致谢	第62页