首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于内容和用户标识的混合型垃圾弹幕识别与过滤研究

摘要第5-6页
ABSTRACT第6页
1 绪论第9-16页
    1.1 研究背景与研究意义第9-11页
        1.1.1 研究背景第9-10页
        1.1.2 研究意义第10-11页
    1.2 研究问题与研究方法第11-13页
        1.2.1 研究问题第11-12页
        1.2.2 研究方法第12-13页
    1.3 研究创新第13页
    1.4 研究主要内容与技术路线第13-16页
        1.4.1 主要内容第13-14页
        1.4.2 技术路线第14-16页
2 国内外相关研究第16-27页
    2.1 弹幕的相关研究第16-19页
        2.1.1 弹幕表现特征及弹幕文化相关研究第16-18页
        2.1.2 弹幕传播媒介相关研究第18-19页
        2.1.3 弹幕分析技术相关研究第19页
    2.2 垃圾文本识别研究第19-25页
        2.2.1 文本分类算法角度相关研究第20-22页
        2.2.2 文本类型角度相关研究第22-25页
        2.2.3 基于身份标识的垃圾文本识别技术第25页
    2.3 本章小结第25-27页
3 模型构建第27-40页
    3.1 引言第27-28页
    3.2 文本预处理第28-30页
        3.2.1 数据抽样第29页
        3.2.2 中文分词研究第29-30页
    3.3 特征选取第30-33页
        3.3.1 卡方检验第31页
        3.3.2 信息增益第31-32页
        3.3.3 互信息第32页
        3.3.4 期望交叉熵第32-33页
    3.4 基于内容的朴素贝叶斯分类器构建第33-36页
        3.4.1 弹幕文本特点第33-34页
        3.4.2 垃圾弹幕特点第34页
        3.4.3 基于内容的朴素贝叶斯分类器第34-36页
    3.5 基于身份标识的贝叶斯模型构建第36-37页
    3.6 基于贝叶斯的混合型弹幕分类第37页
    3.7 贝叶斯识别的反馈学习第37-38页
        3.7.1 增量式学习第37-38页
        3.7.2 重新学习第38页
        3.7.3 混合型贝叶斯算法的反馈学习第38页
    3.8 本章小结第38-40页
4 实验分析及算法评价第40-53页
    4.1 实验环境第40页
    4.2 实验数据集第40-43页
    4.3 实验分析评价指标第43-45页
    4.4 实验测试集选取方法第45-46页
    4.5 实验过程设计第46页
    4.6 实验过程与结论第46-53页
        4.6.1 预处理第46-49页
        4.6.2 对比实验过程及结果第49-53页
5 主要结论及研究展望第53-55页
    5.1 主要结论第53-54页
    5.2 后续研究展望第54-55页
致谢第55-57页
参考文献第57-61页
附录一:部分json原始数据第61-63页
附录二:解析json原始数据第63-66页
附录三:贝叶斯核心算法实现第66-72页
附录四:作者在读期间发表的学术论文及参加的科研项目第72页

论文共72页,点击 下载论文
上一篇:电子知人测验在武警救援部队新兵筛检和缋效评估中效度研究
下一篇:铜催化芳基硼酸酰胺化和富电子芳烃区域选择性C-H键磺酰氧化