基于内容和用户标识的混合型垃圾弹幕识别与过滤研究

摘要	第5-6页
ABSTRACT	第6页
1 绪论	第9-16页
1.1 研究背景与研究意义	第9-11页
1.1.1 研究背景	第9-10页
1.1.2 研究意义	第10-11页
1.2 研究问题与研究方法	第11-13页
1.2.1 研究问题	第11-12页
1.2.2 研究方法	第12-13页
1.3 研究创新	第13页
1.4 研究主要内容与技术路线	第13-16页
1.4.1 主要内容	第13-14页
1.4.2 技术路线	第14-16页
2 国内外相关研究	第16-27页
2.1 弹幕的相关研究	第16-19页
2.1.1 弹幕表现特征及弹幕文化相关研究	第16-18页
2.1.2 弹幕传播媒介相关研究	第18-19页
2.1.3 弹幕分析技术相关研究	第19页
2.2 垃圾文本识别研究	第19-25页
2.2.1 文本分类算法角度相关研究	第20-22页
2.2.2 文本类型角度相关研究	第22-25页
2.2.3 基于身份标识的垃圾文本识别技术	第25页
2.3 本章小结	第25-27页
3 模型构建	第27-40页
3.1 引言	第27-28页
3.2 文本预处理	第28-30页
3.2.1 数据抽样	第29页
3.2.2 中文分词研究	第29-30页
3.3 特征选取	第30-33页
3.3.1 卡方检验	第31页
3.3.2 信息增益	第31-32页
3.3.3 互信息	第32页
3.3.4 期望交叉熵	第32-33页
3.4 基于内容的朴素贝叶斯分类器构建	第33-36页
3.4.1 弹幕文本特点	第33-34页
3.4.2 垃圾弹幕特点	第34页
3.4.3 基于内容的朴素贝叶斯分类器	第34-36页
3.5 基于身份标识的贝叶斯模型构建	第36-37页
3.6 基于贝叶斯的混合型弹幕分类	第37页
3.7 贝叶斯识别的反馈学习	第37-38页
3.7.1 增量式学习	第37-38页
3.7.2 重新学习	第38页
3.7.3 混合型贝叶斯算法的反馈学习	第38页
3.8 本章小结	第38-40页
4 实验分析及算法评价	第40-53页
4.1 实验环境	第40页
4.2 实验数据集	第40-43页
4.3 实验分析评价指标	第43-45页
4.4 实验测试集选取方法	第45-46页
4.5 实验过程设计	第46页
4.6 实验过程与结论	第46-53页
4.6.1 预处理	第46-49页
4.6.2 对比实验过程及结果	第49-53页
5 主要结论及研究展望	第53-55页
5.1 主要结论	第53-54页
5.2 后续研究展望	第54-55页
致谢	第55-57页
参考文献	第57-61页
附录一：部分json原始数据	第61-63页
附录二：解析json原始数据	第63-66页
附录三：贝叶斯核心算法实现	第66-72页
附录四：作者在读期间发表的学术论文及参加的科研项目	第72页