一种基于支持向量机的垃圾微博识别方法

摘要	第1-5页
Abstract	第5-8页
第一章绪论	第8-17页
·微博	第8-9页
·微博特性	第9-10页
·碎片化	第9页
·多方式接入性	第9页
·信息传播性	第9页
·话题多样性	第9-10页
·交互方向	第10页
·微博中的垃圾现象	第10-11页
·垃圾危害	第11-12页
·研究现状	第12-15页
·网址处理	第12-13页
·URL 黑名单	第13页
·基于特征提取的垃圾识别	第13-14页
·垃圾用户行为策略分析	第14-15页
·用户检测	第15页
·主要研究工作	第15-16页
·论文结构	第16-17页
第二章支持向量机与特征提取理论	第17-23页
·机器学习概述	第17页
·支持向量机	第17-21页
·构造最优超平面	第17-19页
·线性支持向量机的基本思想	第19页
·非线性分类	第19-20页
·核函数	第20页
·不平衡数据集	第20-21页
·向量空间模型	第21页
·词频逆文档频率	第21-22页
·本章小结	第22-23页
第三章特征设计	第23-37页
·特征分析与设计	第23-31页
·文本特征	第23-24页
·符号特征	第24-26页
·链接特征	第26-28页
·时间特征	第28-29页
·用户自身特征	第29-31页
·散点图分析	第31-35页
·特征汇总	第35-36页
·本章小结	第36-37页
第四章系统设计与实现	第37-48页
·引入	第37页
·功能需求	第37-38页
·系统总体结构	第38-39页
·文本过滤处理方法	第39-41页
·分词工具 ICTCLAS	第40页
·停用词消除	第40-41页
·符号提取技术(正则表达式)	第41页
·LIBSVM	第41-43页
·LibSVM 数据格式	第41-42页
·归一化	第42页
·训练数据	第42-43页
·预测	第43页
·系统工作流设计	第43-47页
·预处理及训练阶段流程	第43-45页
·分类阶段	第45-46页
·分类过程（机器学习）	第46页
·识别流程	第46-47页
·本章小结	第47-48页
第五章实验与评估	第48-54页
·使用的数据集	第48页
·数据分析	第48-49页
·实验结果	第49页
·识别效果的评价标准	第49-50页
·实验对比	第50-51页
·PAJEK	第51-52页
·系统展示	第52-53页
·本章小结	第53-54页
第六章总结	第54-55页
参考文献	第55-58页
在学研究成果	第58-59页
致谢	第59页