首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于多结构特征的垃圾博客识别研究

中文摘要第1-9页
ABSTRACT第9-11页
第一章 引言第11-17页
   ·研究背景第11-13页
   ·研究现状与分析第13-15页
     ·博客的相关概念第13-14页
     ·垃圾博客的定义第14页
     ·垃圾博客识别研究现状第14-15页
   ·论文的主要内容第15页
   ·论文结构第15-17页
第二章 垃圾博客的结构特征提取第17-25页
   ·基于作弊目的分析的作弊特征第17-18页
   ·垃圾博客特征分析与提取第18-25页
     ·基于博客目录页的特征第18-20页
     ·基于博文页面的特征第20-25页
第三章 博客采集系统的构建和数据的预处理第25-33页
   ·待采集博文地址列表的获取第25-26页
   ·博客采集系统的构建第26-30页
     ·博客采集系统工作流程示意图第26-27页
     ·博客采集系统关键技术介绍第27-28页
     ·博客采集系统的实现第28-30页
   ·数据预处理及文本表示第30-33页
     ·数据预处理第30-31页
     ·文本表示第31-33页
第四章 基于朴素贝叶斯和SVM的垃圾博客识别模型第33-37页
   ·多结构特征的结合第33页
   ·基于多结构特征的朴素贝叶斯分类模型第33-35页
     ·多结构特征和朴素贝叶斯分类法的结合第34-35页
     ·基于朴素贝叶斯分类方法的识别模型第35页
   ·基于多结构特征的支持向量机分类模型第35-37页
     ·支持向量机第35-36页
     ·基于SVM分类方法的识别模型第36-37页
第五章 实验结果与分析第37-41页
   ·实验数据集第37页
   ·评价指标第37-38页
   ·实验结果与分析第38-41页
     ·准确率第38页
     ·特征项的个数对识别性能的影响第38-39页
     ·训练集规膜对识别性能的影响第39-41页
第六章 本文工作总结和展望第41-43页
参考文献第43-47页
攻读学位期间取得的研究成果第47-49页
致谢第49-51页
个人简况及联系方式第51-55页

论文共55页,点击 下载论文
上一篇:采用BP神经网络的分布式入侵检测模型构建
下一篇:基于Web的比较观点挖掘方法研究