一种基于数据挖掘的垃圾短信识别方法的研究
摘要 | 第1-5页 |
ABSTRACT | 第5-9页 |
第一章 背景与意义 | 第9-16页 |
·研究的背景 | 第9-11页 |
·垃圾短信的范围 | 第9-10页 |
·垃圾短信危害严重的原因 | 第10-11页 |
·研究的意义 | 第11-14页 |
·研究的可行性 | 第14-16页 |
第二章 垃圾短信治理支撑系统架构 | 第16-27页 |
·垃圾短信治理支撑系统技术架构与主要功能 | 第16-18页 |
·数据层部分核心技术实现 | 第18-24页 |
·数据仓库技术与实现 | 第18-19页 |
·中央数据仓库的结构 | 第19-21页 |
·中央数据仓库的信息组成 | 第21-23页 |
·核心技术ETL 技术的实现 | 第23-24页 |
·应用层部分核心技术实现 | 第24-26页 |
·数据处理模型 | 第24页 |
·联机分析处理技术 | 第24-26页 |
·执行层部分核心技术实现 | 第26-27页 |
第三章 数据挖掘技术与决策树算法实现 | 第27-38页 |
·数据挖掘的概念与意义 | 第27-31页 |
·数据挖掘的概念 | 第27-29页 |
·数据挖掘功能 | 第29-31页 |
·数据挖掘过程 | 第31页 |
·决策树算法的原理与实现 | 第31-38页 |
·决策树算法概述 | 第31-32页 |
·决策树C5.0 算法 | 第32-36页 |
·C5.0 算法的四步骤 | 第36-38页 |
第四章 垃圾短信识别模型建立过程 | 第38-59页 |
·模型建设思路与过程 | 第38-39页 |
·历史样本抽取 | 第39-40页 |
·关键变量筛选 | 第40-48页 |
·关键变量过程 | 第40-47页 |
·部分关键变量说明 | 第47-48页 |
·决策树模型计算与规则树生成 | 第48-56页 |
·C5.0 决策树的生长过程 | 第48-52页 |
·对连续值变量的分组处理 | 第52-56页 |
·正常短信过滤 | 第56-57页 |
·模型调优与验证 | 第57-59页 |
第五章 垃圾短信识别模型后续应用情况 | 第59-67页 |
·模型日常应用情况 | 第59-62页 |
·应用思路 | 第59-60页 |
·数据更新更新调优机制 | 第60-62页 |
·系统运作情况 | 第62-63页 |
·市场策略的改进意见 | 第63-67页 |
·长期的控制需要市场策略杠杆 | 第63-64页 |
·部分有助于改进市场策略的联机分析结果 | 第64-67页 |
第六章 总结与展望 | 第67-71页 |
·技术经验总结和思考 | 第67-69页 |
·技术经验总结 | 第67-68页 |
·带来的思考 | 第68-69页 |
·未来展望 | 第69-71页 |
结论 | 第71-72页 |
参考文献 | 第72-74页 |
致谢 | 第74-75页 |
攻读硕士学位期间已发表或录用的论文 | 第75-77页 |