基于ATN算法和潜在语义索引的不良信息过滤系统研究
| 摘要 | 第1-7页 |
| Abstract | 第7-8页 |
| 目录 | 第8-11页 |
| 第1章 绪论 | 第11-15页 |
| ·选题背景及意义 | 第11页 |
| ·国内外研究现状 | 第11-13页 |
| ·项目背景和研究内容 | 第13-14页 |
| ·本文的组织结构 | 第14-15页 |
| 第2章 相关知识介绍 | 第15-23页 |
| ·不良信息过滤技术 | 第15-17页 |
| ·基于网址的过滤研究 | 第15页 |
| ·基于内容的过滤 | 第15-16页 |
| ·混合过滤 | 第16-17页 |
| ·扩充转移网络算法(ATN) | 第17-19页 |
| ·ATN算法产生背景 | 第17页 |
| ·ATN算法的实现流程 | 第17-18页 |
| ·ATN算法的优缺点 | 第18-19页 |
| ·互联网选择平台(PICS) | 第19-20页 |
| ·PICS产生的背景 | 第19页 |
| ·PICS技术的三个概念 | 第19页 |
| ·基于PICS的过滤软件的原理 | 第19页 |
| ·PICS系统的优缺点 | 第19-20页 |
| ·潜在语义索引模型(LSI) | 第20-21页 |
| ·LSI算法产生相关背景 | 第20页 |
| ·LSI算法的实现流程 | 第20-21页 |
| ·LSI算法的优缺点 | 第21页 |
| ·中文分词技术在不良信息过滤中作用 | 第21-22页 |
| ·本章小结 | 第22-23页 |
| 第3章 系统关键技术分析 | 第23-45页 |
| ·系统技术基础 | 第23-26页 |
| ·Spring简介 | 第23-25页 |
| ·Hibernate简介 | 第25页 |
| ·Dojo简介 | 第25-26页 |
| ·系统架构设计 | 第26-27页 |
| ·系统表结构设计 | 第27-29页 |
| ·中文预处理模块设计 | 第29-34页 |
| ·名词短语网络结构设计 | 第30-31页 |
| ·动宾短语网络结构设计 | 第31-32页 |
| ·介词短语网络结构设计 | 第32-33页 |
| ·句型网络结构设计 | 第33-34页 |
| ·寄存器 | 第34页 |
| ·中文去噪处理 | 第34页 |
| ·信息过滤模块设计 | 第34-38页 |
| ·向量空间模型 | 第35-36页 |
| ·文档相似度计算 | 第36-37页 |
| ·矩阵奇异值分解 | 第37-38页 |
| ·PICS模块设计 | 第38-40页 |
| ·PICS标签格式的定义 | 第38-39页 |
| ·PICS标签等级的划分 | 第39-40页 |
| ·系统关键问题及解决办法 | 第40-44页 |
| ·创建词库 | 第41-42页 |
| ·ATN效率问题 | 第42页 |
| ·ATN歧义问题 | 第42-43页 |
| ·样本集的获取 | 第43-44页 |
| ·特征词权重计算 | 第44页 |
| ·本章小结 | 第44-45页 |
| 第4章 系统实现及垃圾邮件概念空间的构建 | 第45-57页 |
| ·中文预处理模块工作流程 | 第45-46页 |
| ·信息过滤模块工作流程 | 第46-47页 |
| ·PICS模块工作流程 | 第47页 |
| ·人机交互模块工作流程及实现 | 第47-52页 |
| ·系统主界面 | 第48-49页 |
| ·文档类型管理功能 | 第49-50页 |
| ·实验分析功能模块 | 第50-51页 |
| ·实验参数管理模块 | 第51页 |
| ·词库管理模块 | 第51-52页 |
| ·中文邮件样本集(CDSCE) | 第52-53页 |
| ·构建垃圾邮件概念空间模型 | 第53-56页 |
| ·中文分词处理 | 第53-54页 |
| ·统计特征词词频 | 第54-55页 |
| ·计算特征词权重 | 第55页 |
| ·构造词文档矩阵 | 第55-56页 |
| ·奇异值分解 | 第56页 |
| ·本章小结 | 第56-57页 |
| 第5章 实验及结果分析 | 第57-64页 |
| ·实验参数的确定 | 第57-58页 |
| ·实验数据集 | 第57页 |
| ·K值范围的确定 | 第57页 |
| ·实验测试集 | 第57页 |
| ·实验性能指标 | 第57-58页 |
| ·实验归档处理 | 第58页 |
| ·实验过程描述 | 第58-59页 |
| ·实验结果及分析 | 第59-63页 |
| ·DS_1500实验结果及分析 | 第59页 |
| ·DS_2500实验结果及分析 | 第59-60页 |
| ·DS_3500实验结果及分析 | 第60-61页 |
| ·系统K值的确定及最终实验结果 | 第61页 |
| ·实验对比 | 第61-63页 |
| ·本章小结 | 第63-64页 |
| 结论与展望 | 第64-66页 |
| 论文总结 | 第64页 |
| 未来展望 | 第64-66页 |
| 致谢 | 第66-67页 |
| 参考文献 | 第67-71页 |
| 攻读学位期间发表的论文 | 第71页 |