摘要 | 第1-6页 |
ABSTRACT | 第6-10页 |
第一章 绪论 | 第10-15页 |
·研究背景及意义 | 第10-11页 |
·国内外研究现状 | 第11-13页 |
·本文的研究内容和结构安排 | 第13-14页 |
·本章小结 | 第14-15页 |
第二章 网页文本关键字相关技术介绍 | 第15-26页 |
·目前主要的网页过滤方法 | 第15-18页 |
·网页内容分级法 | 第15-16页 |
·URL地址列表法 | 第16-17页 |
·文本分析法 | 第17页 |
·多媒体信息过滤技术 | 第17-18页 |
·动态跟踪技术 | 第18页 |
·网页关键字过滤的数学模型 | 第18-22页 |
·布尔模型(Boolean Model) | 第18-19页 |
·向量模型(Vector Space Model) | 第19-21页 |
·概率模型(Probobilistic Model) | 第21-22页 |
·潜在语义索引模型(Latent Semantic Indexing Model) | 第22页 |
·文本过滤系统性能的评价 | 第22-25页 |
·召回率、准确率 | 第23页 |
·F值 | 第23-24页 |
·Utility | 第24页 |
·E值 | 第24-25页 |
·本章小结 | 第25-26页 |
第三章 网页文本关键字过滤系统的总体设计 | 第26-30页 |
·系统功能要求 | 第27-28页 |
·系统运行环境 | 第28页 |
·系统工作流程 | 第28-29页 |
·本章小结 | 第29-30页 |
第四章 数据捕获子系统 | 第30-40页 |
·TCP协议 | 第30-32页 |
·基于WinPcap的数据包包捕获 | 第32-37页 |
·数据包捕获原理 | 第32页 |
·基于Windows平台的数据包捕获实现 | 第32-37页 |
·数据重组 | 第37-39页 |
·本章小结 | 第39-40页 |
第五章 网页文本关键字过滤子系统 | 第40-51页 |
·文本预处理 | 第41-44页 |
·无关信息过滤 | 第41-42页 |
·含有特殊符号的敏感词处理 | 第42页 |
·含有拼音的敏感词处理 | 第42-43页 |
·含有偏旁部首的敏感字的处理 | 第43页 |
·其他形式 | 第43-44页 |
·高频词的提取 | 第44-45页 |
·中文分词 | 第45-48页 |
·正向最大匹配法 | 第46-47页 |
·逆向最大匹配法 | 第47页 |
·双向最大匹配法 | 第47-48页 |
·最少切分法 | 第48页 |
·字典的扩充 | 第48-49页 |
·权值算法的改进 | 第49-50页 |
·本章小结 | 第50-51页 |
第六章 实验结果分析 | 第51-56页 |
第七章 总结与展望 | 第56-58页 |
·总结 | 第56-57页 |
·展望 | 第57-58页 |
参考文献 | 第58-62页 |
致谢 | 第62页 |