首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

一种改进的TF-IDF算法实现及其在垃圾邮件识别中的应用

摘要第1-6页
Abstract第6-8页
目录第8-11页
第1章 绪论第11-15页
   ·研究背景及意义第11-12页
   ·国内外研究现状第12-13页
   ·本文工作第13-14页
   ·论文结构安排第14-15页
第2章 理论知识准备第15-23页
   ·文本挖掘与文本分类第15-17页
   ·邮件分析第17-18页
   ·向量空间模型第18-19页
   ·支持向量机第19-20页
   ·信息熵的相关理论第20-21页
   ·评价体系第21-23页
第3章 对 TF-IDF 算法的改进策略第23-35页
   ·TF-IDF 算法第23-26页
     ·TF 值的计算第23-24页
     ·IDF 权值的计算第24-25页
     ·算法流程第25-26页
   ·TF-IDF 算法的不足第26-27页
   ·对 TF-IDF 算法的改进第27-31页
     ·引入信息熵因子第27-28页
     ·引入内容和位置权重第28-29页
     ·独立性系数第29-30页
     ·简化 IDF 参数及系数修正第30-31页
   ·改进后的算法流程第31-32页
   ·邮件分类第32页
   ·算法可行性检验第32-35页
第4章 垃圾邮件过滤系统的设计与实现第35-46页
   ·垃圾邮件过滤系统综述第35页
   ·基于 TF-IDF 改进算法的反垃圾邮件模型设计第35-37页
   ·系统功能模块及用户界面介绍第37-38页
   ·训练模块第38-43页
     ·文本分词包第38-39页
     ·特征选择包第39-41页
     ·模式转换包第41-42页
     ·机器学习包第42-43页
   ·测试模块第43-44页
   ·统计模块第44-46页
第5章 结果评测与分析第46-49页
   ·试验对象选取第46页
   ·试验结果分析第46-49页
     ·原算法与改进各项的测试结果对比第46-47页
     ·与腾讯邮件识别系统的对比第47-49页
第6章 总结与展望第49-50页
参考文献第50-53页
致谢第53页

论文共53页,点击 下载论文
上一篇:动态社会网络社区发现算法研究
下一篇:基于规则引擎的警报关联系统的设计与实现