首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于粗糙集和朴素贝叶斯的中文垃圾短信过滤方法研究

摘要第4-5页
Abstract第5页
目录第6-8页
1 绪论第8-14页
    1.1 研究背景和意义第8页
    1.2 垃圾短信当前状况第8-11页
        1.2.1 垃圾短信的定义和分类第8-9页
        1.2.2 垃圾短信成因第9页
        1.2.3 国内外垃圾短信现状第9-11页
    1.3 本论文的主要研究内容和组织结构第11-14页
        1.3.1 主要研究内容第11-12页
        1.3.2 论文组织第12-14页
2 文本分类概述第14-22页
    2.1 文本分类流程第14页
    2.2 文本预处理第14-16页
        2.2.1 文本分词第14-15页
        2.2.2 去停用词第15-16页
    2.3 文本表示第16-17页
        2.3.1 向量空间模型第16页
        2.3.2 概念模型第16页
        2.3.3 概率模型第16-17页
    2.4 特征选择第17页
    2.5 分类方法第17-21页
        2.5.1 朴素贝叶斯方法第18页
        2.5.2 支持向量机第18-20页
        2.5.3 k近邻方法第20页
        2.5.4 决策树第20-21页
    2.6 本章小结第21-22页
3 特征加权方法的相关研究第22-31页
    3.1 特征选择第22-25页
        3.1.1 词频逆文档频率第22-23页
        3.1.2 互信息第23页
        3.1.3 信息增益第23-24页
        3.1.4 χ~2统计方法第24页
        3.1.5 几率比第24页
        3.1.6 期望交叉熵第24-25页
        3.1.7 特征熵第25页
    3.2 特征选择方法性能评价指标第25-26页
    3.3 特征加权改进第26-30页
        3.3.1 最小分类错误方法第26-28页
        3.3.2 改进的权重公式第28-30页
    3.4 四种特征选择的实验比较第30页
    3.5 本章小结第30-31页
4 结合粗糙集和朴素贝叶斯的短信分类第31-38页
    4.1 粗糙集理论第31-35页
        4.1.1 概述第31页
        4.1.2 粗糙集相关定义第31-35页
    4.2 粗糙集与朴素贝叶斯的结合第35-37页
    4.3 本章小结第37-38页
5 短信分类系统的设计与实现第38-46页
    5.1 系统总体设计第38页
    5.2 系统详细设计第38-44页
        5.2.1 短信语料库模块第40-41页
        5.2.2 预处理模块第41-42页
        5.2.3 向量空间表示模块第42-43页
        5.2.4 属性值离散化模块第43页
        5.2.5 粗糙集过滤模块第43页
        5.2.6 朴素贝叶斯分类模块第43-44页
    5.3 实验评估第44-45页
    5.4 本章小结第45-46页
6 总结与展望第46-48页
    6.1 论文工作总结第46页
    6.2 展望第46-48页
参考文献第48-51页
攻读硕士学位期间发表的论文第51-52页
致谢第52页

论文共52页,点击 下载论文
上一篇:干旱胁迫下木薯叶片蛋白质组学的初步研究
下一篇:基于改进遗传算法的最大类间方差图像分割方法研究