中文垃圾短文本的自动识别研究

摘要	第4-5页
Abstract	第5-6页
1. 引言	第10-15页
1.1 研究背景及意义	第10-11页
1.2 国内外研究现状	第11-13页
1.3 主要研究工作	第13-14页
1.4 本文组织结构	第14-15页
2. 相关研究	第15-22页
2.1 常用分类算法	第15-19页
2.1.1 朴素贝叶斯	第15页
2.1.2 决策树	第15-16页
2.1.3 逻辑回归	第16页
2.1.4 BP神经网络	第16-17页
2.1.5 支持向量机	第17-19页
2.2 集成学习算法	第19-20页
2.2.1 随机森林	第19页
2.2.2 Adaboost	第19-20页
2.3 本章小结	第20-22页
3. 垃圾短文本的识别方法研究	第22-38页
3.1 预处理	第22-24页
3.2 特征提取	第24-35页
3.2.1 短信特征提取	第25-29页
3.2.2 评论特征提取	第29-35页
3.3“随机森林+Adaboost”算法	第35-37页
3.4 本章小结	第37-38页
4. 垃圾短文本识别的实验及结果分析	第38-51页
4.1 垃圾短信的识别	第38-44页
4.1.1 垃圾短信识别过程	第38-39页
4.1.2 实验数据及评估指标	第39-40页
4.1.3 实验及结果分析	第40-44页
4.2 垃圾商品评论的识别	第44-50页
4.2.1 垃圾评论识别过程	第44-45页
4.2.2 实验数据及评估指标	第45-46页
4.2.3 实验及结果分析	第46-50页
4.3 本章小结	第50-51页
5. 结论与展望	第51-53页
5.1 结论	第51页
5.2 展望	第51-53页
参考文献	第53-56页
个人履历、在校期间发表的学术论文	第56-57页
个人履历	第56页
在校期间发表的学术论文	第56-57页
致谢	第57页