| 摘要 | 第1-6页 |
| ABSTRACT | 第6-10页 |
| 第一章 绪论 | 第10-15页 |
| ·研究背景及意义 | 第10-11页 |
| ·国内外研究现状 | 第11-13页 |
| ·本文的研究内容和结构安排 | 第13-14页 |
| ·本章小结 | 第14-15页 |
| 第二章 网页文本关键字相关技术介绍 | 第15-26页 |
| ·目前主要的网页过滤方法 | 第15-18页 |
| ·网页内容分级法 | 第15-16页 |
| ·URL地址列表法 | 第16-17页 |
| ·文本分析法 | 第17页 |
| ·多媒体信息过滤技术 | 第17-18页 |
| ·动态跟踪技术 | 第18页 |
| ·网页关键字过滤的数学模型 | 第18-22页 |
| ·布尔模型(Boolean Model) | 第18-19页 |
| ·向量模型(Vector Space Model) | 第19-21页 |
| ·概率模型(Probobilistic Model) | 第21-22页 |
| ·潜在语义索引模型(Latent Semantic Indexing Model) | 第22页 |
| ·文本过滤系统性能的评价 | 第22-25页 |
| ·召回率、准确率 | 第23页 |
| ·F值 | 第23-24页 |
| ·Utility | 第24页 |
| ·E值 | 第24-25页 |
| ·本章小结 | 第25-26页 |
| 第三章 网页文本关键字过滤系统的总体设计 | 第26-30页 |
| ·系统功能要求 | 第27-28页 |
| ·系统运行环境 | 第28页 |
| ·系统工作流程 | 第28-29页 |
| ·本章小结 | 第29-30页 |
| 第四章 数据捕获子系统 | 第30-40页 |
| ·TCP协议 | 第30-32页 |
| ·基于WinPcap的数据包包捕获 | 第32-37页 |
| ·数据包捕获原理 | 第32页 |
| ·基于Windows平台的数据包捕获实现 | 第32-37页 |
| ·数据重组 | 第37-39页 |
| ·本章小结 | 第39-40页 |
| 第五章 网页文本关键字过滤子系统 | 第40-51页 |
| ·文本预处理 | 第41-44页 |
| ·无关信息过滤 | 第41-42页 |
| ·含有特殊符号的敏感词处理 | 第42页 |
| ·含有拼音的敏感词处理 | 第42-43页 |
| ·含有偏旁部首的敏感字的处理 | 第43页 |
| ·其他形式 | 第43-44页 |
| ·高频词的提取 | 第44-45页 |
| ·中文分词 | 第45-48页 |
| ·正向最大匹配法 | 第46-47页 |
| ·逆向最大匹配法 | 第47页 |
| ·双向最大匹配法 | 第47-48页 |
| ·最少切分法 | 第48页 |
| ·字典的扩充 | 第48-49页 |
| ·权值算法的改进 | 第49-50页 |
| ·本章小结 | 第50-51页 |
| 第六章 实验结果分析 | 第51-56页 |
| 第七章 总结与展望 | 第56-58页 |
| ·总结 | 第56-57页 |
| ·展望 | 第57-58页 |
| 参考文献 | 第58-62页 |
| 致谢 | 第62页 |