首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

不良内容网页过滤技术的研究

摘要第1-6页
ABSTRACT第6-11页
1 绪论第11-19页
   ·课题的研究背景与意义第11-15页
   ·国内外研究现状第15-16页
   ·网页文本过滤技术的应用第16-17页
   ·本文的研究内容与成果第17-19页
2 信息过滤综述第19-27页
   ·信息过滤的概念第19-20页
   ·信息过滤与信息检索第20-21页
   ·信息过滤系统的分类第21-23页
     ·根据操作方法分类第21-22页
     ·根据操作位置分类第22页
     ·按照信息过滤方法分类第22页
     ·按照用户获取信息方法分类第22-23页
   ·信息过滤系统模型第23-25页
     ·布尔模型(Boolean model)第23页
     ·向量空间模型(vector space model)第23-25页
     ·概率模型(probability model)第25页
   ·信息过滤系统性能第25-26页
   ·本章小结第26-27页
3 网页文本过滤技术第27-38页
   ·网页文本内容抽取第27-30页
   ·中文分词第30-33页
     ·基于词典的中文分词方法第30-31页
     ·基于统计的分词方法第31-32页
     ·基于规则的分词方法第32-33页
   ·停用词处理第33页
   ·特征项提取第33-35页
     ·文档频率(Document Frequency:DF)第33-34页
     ·信息增益(Information Gain:IG)第34页
     ·互信息(Mutual Information:MI)第34-35页
     ·X~2统计量(Chi-square Statistic:CHI)第35页
   ·文本分类方法第35-37页
     ·Navie Bayes(朴素贝叶斯方法)第35-36页
     ·KNN 方法(K 近邻方法)第36-37页
     ·SVM 方法(支持向量机)第37页
   ·分类阈值第37页
   ·本章小结第37-38页
4 本文中文本过滤主要方法的设计第38-54页
   ·基于文本密度值的网页内容抽取方法第38-43页
     ·文本密度(TEXT DENSITY:TD)第38-41页
     ·网页文本内容抽取方法第41-43页
     ·实验结果和结果分析第43页
   ·BM2C 模式匹配方法第43-50页
     ·BM 及其改进模式匹配方法第43-46页
     ·BM2C 模式匹配方法第46-48页
     ·实验结果和结果分析第48-50页
   ·改进 X~2统计量文本特征项提取方法第50-53页
     ·X~2统计量存在的问题及其改进第50-51页
     ·实验结果与结果分析第51-53页
   ·本章小结第53-54页
5 过滤系统的设计第54-65页
   ·本文过滤系统模块第54-62页
     ·第一层基于关键词匹配过滤系统模型第54-57页
     ·第二层基于内容智能过滤系统模型第57-62页
   ·实验结果及分析第62-64页
     ·实验环境第62页
     ·实验文本集的建立第62-63页
     ·实验结果及结果分析第63-64页
   ·本章小结第64-65页
6 总结和展望第65-67页
   ·工作总结第65页
   ·下一步需要做的工作第65-67页
符号说明第67-68页
参考文献第68-72页
致谢第72-73页
攻读学位期间发表的学术论文目录第73页

论文共73页,点击 下载论文
上一篇:E类功率放大器在视觉假体中能量与数据无线传输中的设计
下一篇:无模型动态矩阵控制方法研究与应用