首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于频繁模式挖掘的不良消息文本检测方法研究与实现

摘要第5-6页
Abstract第6页
第一章 绪论第7-11页
    1.1 课题背景与意义第7-9页
        1.1.1 研究现状第7-8页
        1.1.2 课题的实际意义第8页
        1.1.3 课题的理论意义第8-9页
    1.2 论文主要工作第9-10页
    1.3 论文组织结构第10-11页
第二章 不良消息文本检测的相关技术第11-21页
    2.1 消息文本概述第11页
    2.2 不良文本检测方法概述第11-12页
    2.3 消息文本中的频繁模式概述第12-14页
        2.3.1 关联规则中频繁模式基本概念第12-13页
        2.3.2 频繁项集挖掘经典算法介绍第13-14页
    2.4 文本分类概述第14-21页
        2.4.1 基于统计学习的文本分类第15-16页
        2.4.2 特征选择和计算第16-19页
        2.4.3 分类计算第19-21页
第三章 基于频繁模式挖掘的不良消息文本检测方法设计第21-42页
    3.1 设计目标第21-22页
    3.2 总体设计思路第22-23页
    3.3 不良消息文本预处理第23-29页
        3.3.1 中国科学院计算技术研究所汉语词法分析系统第24-27页
        3.3.2 不良消息文本预处理策略研究第27页
        3.3.3 不良消息文本预处理中词性和命名实体的处理规则第27-28页
        3.3.4 不良消息文本预处理算法流程第28-29页
    3.4 不良消息文本频繁模式挖掘第29-34页
        3.4.1 消息文本频繁模式的基本概念第29页
        3.4.2 不良消息文本频繁模式提取研究第29-30页
        3.4.3 不良消息文本频繁项词集发现第30-32页
        3.4.4 不良消息文本频繁字符串模式提取第32-33页
        3.4.5 不良消息文本模式提取算法第33-34页
    3.5 不良消息文本分类检测第34-42页
        3.5.1 词语相似度计算第34-35页
        3.5.2 基于《同义词词林》词语相似度计算第35-38页
        3.5.3 消息文本与频繁模式字符串之间子串判断第38-40页
        3.5.4 消息文本与频繁模式字符串相似度计算第40-42页
第四章 基于频繁模式挖掘的不良消息文本检测方法实现第42-52页
    4.1 实验开发和运行环境第42页
    4.2 不良消息文本检测方法流程图第42-46页
        4.2.1 不良消息文本预处理流程第43-44页
        4.2.2 不良消息文本频繁模式提取流程第44-45页
        4.2.3 不良消息文本分类流程第45-46页
    4.3 方法中关键数据结构第46-48页
    4.4 实验对比与分析第48-52页
第五章 总结与展望第52-54页
参考文献第54-58页
致谢第58-59页

论文共59页,点击 下载论文
上一篇:IPTV视频质量监测系统研究
下一篇:基于云计算的电视内容信息服务平台的设计和实现