首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于规则和统计的网络不良信息识别研究

摘要第5-7页
ABSTRACT第7-8页
第一章 绪论第12-19页
    1.1 研究背景和意义第12-13页
    1.2 国内外研究现状第13-16页
        1.2.1 网络发展现状第13-14页
        1.2.2 社交应用发展现状第14-15页
        1.2.3 互联网不良信息及传播特征第15-16页
    1.3 论文研究内容第16-17页
    1.4 论文组织结构第17-19页
第二章 相关理论和技术第19-26页
    2.1 文本信息的预处理第19页
    2.2 成熟的自动分词技术第19-22页
        2.2.1 基于词典的机械分词方法第20页
        2.2.2 基于统计的分词方法第20-21页
        2.2.3 基于人工智能的分词方法第21-22页
    2.3 文本特征表示第22页
        2.3.1 布尔模型第22页
        2.3.2 概率模型第22页
        2.3.3 向量空间模型第22页
    2.4 文本的特征提取方法第22-23页
    2.5 特征降维方法第23-24页
    2.6 数据采集方法第24-25页
    2.7 本章研究内容第25-26页
第三章 不良信息文本分类第26-43页
    3.1 文本分类算法介绍第26-28页
        3.1.1 文本分类流程第26-28页
        3.1.2 分类结果评价第28页
    3.2 不良词词库构建第28-31页
        3.2.1 不良信息表现形式第28-29页
        3.2.2 变形不良词语种类第29页
        3.2.3 不良词库设计第29-31页
    3.3 文本特征选择第31-36页
        3.3.1 基于权重的特征选择第31-32页
        3.3.2 基于依存句法的特征选择第32-35页
        3.3.3 文本相似度计算第35-36页
    3.4 文本分类算法选取第36-40页
        3.4.1 朴素贝叶斯模型第36-39页
        3.4.2 决策树模型第39-40页
    3.5 实验设计与测试第40-43页
        3.5.1 实验环境第40页
        3.5.2 数据集选取第40-41页
        3.5.3 数据预处理第41页
        3.5.4 分类结果评价第41-43页
第四章 不良信息检测系统设计第43-54页
    4.1 微博简介第43-46页
        4.1.1 微博发展现状第43-44页
        4.1.2 微博用户互动行为第44-46页
    4.2 系统总体设计第46-47页
    4.3 微博数据处理第47-52页
        4.3.1 原始数据采集第47-50页
        4.3.2 文本数据处理第50-52页
    4.4 微博文本分类第52-53页
    4.5 本章小结第53-54页
第五章 实验测试与分析第54-61页
    5.1 实验环境第54页
    5.2 实验过程第54-58页
    5.3 评估分类结果第58-61页
第六章 总结和展望第61-64页
    6.1 论文总结第61-62页
    6.2 展望第62-64页
参考文献第64-68页
硕士期间研究成果第68-69页
致谢第69页

论文共69页,点击 下载论文
上一篇:内质网应激、胰岛素抵抗与鹅肥肝形成的关系研究
下一篇:对外汉语新手教师反馈语研究--以华中师范大学为例