首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于ATN算法和潜在语义索引的不良信息过滤系统研究

摘要第1-7页
Abstract第7-8页
目录第8-11页
第1章 绪论第11-15页
   ·选题背景及意义第11页
   ·国内外研究现状第11-13页
   ·项目背景和研究内容第13-14页
   ·本文的组织结构第14-15页
第2章 相关知识介绍第15-23页
   ·不良信息过滤技术第15-17页
     ·基于网址的过滤研究第15页
     ·基于内容的过滤第15-16页
     ·混合过滤第16-17页
   ·扩充转移网络算法(ATN)第17-19页
     ·ATN算法产生背景第17页
     ·ATN算法的实现流程第17-18页
     ·ATN算法的优缺点第18-19页
   ·互联网选择平台(PICS)第19-20页
     ·PICS产生的背景第19页
     ·PICS技术的三个概念第19页
     ·基于PICS的过滤软件的原理第19页
     ·PICS系统的优缺点第19-20页
   ·潜在语义索引模型(LSI)第20-21页
     ·LSI算法产生相关背景第20页
     ·LSI算法的实现流程第20-21页
     ·LSI算法的优缺点第21页
   ·中文分词技术在不良信息过滤中作用第21-22页
   ·本章小结第22-23页
第3章 系统关键技术分析第23-45页
   ·系统技术基础第23-26页
     ·Spring简介第23-25页
     ·Hibernate简介第25页
     ·Dojo简介第25-26页
   ·系统架构设计第26-27页
   ·系统表结构设计第27-29页
   ·中文预处理模块设计第29-34页
     ·名词短语网络结构设计第30-31页
     ·动宾短语网络结构设计第31-32页
     ·介词短语网络结构设计第32-33页
     ·句型网络结构设计第33-34页
     ·寄存器第34页
     ·中文去噪处理第34页
   ·信息过滤模块设计第34-38页
     ·向量空间模型第35-36页
     ·文档相似度计算第36-37页
     ·矩阵奇异值分解第37-38页
   ·PICS模块设计第38-40页
     ·PICS标签格式的定义第38-39页
     ·PICS标签等级的划分第39-40页
   ·系统关键问题及解决办法第40-44页
     ·创建词库第41-42页
     ·ATN效率问题第42页
     ·ATN歧义问题第42-43页
     ·样本集的获取第43-44页
     ·特征词权重计算第44页
   ·本章小结第44-45页
第4章 系统实现及垃圾邮件概念空间的构建第45-57页
   ·中文预处理模块工作流程第45-46页
   ·信息过滤模块工作流程第46-47页
   ·PICS模块工作流程第47页
   ·人机交互模块工作流程及实现第47-52页
     ·系统主界面第48-49页
     ·文档类型管理功能第49-50页
     ·实验分析功能模块第50-51页
     ·实验参数管理模块第51页
     ·词库管理模块第51-52页
   ·中文邮件样本集(CDSCE)第52-53页
   ·构建垃圾邮件概念空间模型第53-56页
     ·中文分词处理第53-54页
     ·统计特征词词频第54-55页
     ·计算特征词权重第55页
     ·构造词文档矩阵第55-56页
     ·奇异值分解第56页
   ·本章小结第56-57页
第5章 实验及结果分析第57-64页
   ·实验参数的确定第57-58页
     ·实验数据集第57页
     ·K值范围的确定第57页
     ·实验测试集第57页
     ·实验性能指标第57-58页
     ·实验归档处理第58页
   ·实验过程描述第58-59页
   ·实验结果及分析第59-63页
     ·DS_1500实验结果及分析第59页
     ·DS_2500实验结果及分析第59-60页
     ·DS_3500实验结果及分析第60-61页
     ·系统K值的确定及最终实验结果第61页
     ·实验对比第61-63页
   ·本章小结第63-64页
结论与展望第64-66页
 论文总结第64页
 未来展望第64-66页
致谢第66-67页
参考文献第67-71页
攻读学位期间发表的论文第71页

论文共71页,点击 下载论文
上一篇:基于ADSP-BF561的人脸识别系统的研究与实现
下一篇:一种基于关系数据库的半自动化本体构建方法