不良内容网页过滤技术的研究

摘要	第1-6页
ABSTRACT	第6-11页
1 绪论	第11-19页
·课题的研究背景与意义	第11-15页
·国内外研究现状	第15-16页
·网页文本过滤技术的应用	第16-17页
·本文的研究内容与成果	第17-19页
2 信息过滤综述	第19-27页
·信息过滤的概念	第19-20页
·信息过滤与信息检索	第20-21页
·信息过滤系统的分类	第21-23页
·根据操作方法分类	第21-22页
·根据操作位置分类	第22页
·按照信息过滤方法分类	第22页
·按照用户获取信息方法分类	第22-23页
·信息过滤系统模型	第23-25页
·布尔模型（Boolean model）	第23页
·向量空间模型（vector space model）	第23-25页
·概率模型（probability model）	第25页
·信息过滤系统性能	第25-26页
·本章小结	第26-27页
3 网页文本过滤技术	第27-38页
·网页文本内容抽取	第27-30页
·中文分词	第30-33页
·基于词典的中文分词方法	第30-31页
·基于统计的分词方法	第31-32页
·基于规则的分词方法	第32-33页
·停用词处理	第33页
·特征项提取	第33-35页
·文档频率（Document Frequency：DF）	第33-34页
·信息增益（Information Gain：IG）	第34页
·互信息（Mutual Information：MI）	第34-35页
·X~2统计量（Chi-square Statistic：CHI）	第35页
·文本分类方法	第35-37页
·Navie Bayes（朴素贝叶斯方法）	第35-36页
·KNN 方法（K 近邻方法）	第36-37页
·SVM 方法（支持向量机）	第37页
·分类阈值	第37页
·本章小结	第37-38页
4 本文中文本过滤主要方法的设计	第38-54页
·基于文本密度值的网页内容抽取方法	第38-43页
·文本密度（TEXT DENSITY：TD）	第38-41页
·网页文本内容抽取方法	第41-43页
·实验结果和结果分析	第43页
·BM2C 模式匹配方法	第43-50页
·BM 及其改进模式匹配方法	第43-46页
·BM2C 模式匹配方法	第46-48页
·实验结果和结果分析	第48-50页
·改进 X~2统计量文本特征项提取方法	第50-53页
·X~2统计量存在的问题及其改进	第50-51页
·实验结果与结果分析	第51-53页
·本章小结	第53-54页
5 过滤系统的设计	第54-65页
·本文过滤系统模块	第54-62页
·第一层基于关键词匹配过滤系统模型	第54-57页
·第二层基于内容智能过滤系统模型	第57-62页
·实验结果及分析	第62-64页
·实验环境	第62页
·实验文本集的建立	第62-63页
·实验结果及结果分析	第63-64页
·本章小结	第64-65页
6 总结和展望	第65-67页
·工作总结	第65页
·下一步需要做的工作	第65-67页
符号说明	第67-68页
参考文献	第68-72页
致谢	第72-73页
攻读学位期间发表的学术论文目录	第73页