首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

面向新浪微博的水军识别技术的研究与实现

摘要第9-10页
ABSTRACT第10-11页
第一章 绪论第12-19页
    1.1 研究背景第12-15页
        1.1.1 微博简介第12-13页
        1.1.2 微博水军及其研究意义第13-15页
    1.2 研究现状第15-16页
    1.3 研究内容及创新点第16-17页
    1.4 论文的组织结构第17-19页
第二章 相关技术研究第19-31页
    2.1 监督学习第19-23页
        2.1.1 C4.5第19-21页
        2.1.2 朴素贝叶斯(Na?ve Bayes)第21页
        2.1.3 支持向量机(SVM)第21-23页
        2.1.4 逻辑回归(Logistic Regression)第23页
    2.2 文本聚类算法第23-28页
        2.2.1 划分方法第24-25页
        2.2.2 层次方法第25-26页
        2.2.3 基于密度的方法第26-27页
        2.2.4 基于网格的方法第27-28页
    2.3 文本相似性算法第28-30页
        2.3.1 Shingle算法第28页
        2.3.2 Simhash算法第28-30页
    2.4 本章小结第30-31页
第三章 微博用户特征及量化方法设计第31-40页
    3.1 用户信息特征第31-33页
        3.1.1 粉丝数,关注数以及FFR(Follower to Friend Ratio)第31-32页
        3.1.2 用户亲密度第32-33页
        3.1.3 用户博文数第33页
    3.2 用户行为特征第33-37页
        3.2.1 用户提及率第34页
        3.2.2 文本URL率第34-35页
        3.2.3 文本话题标签率第35页
        3.2.4 发帖规律第35-37页
    3.3 博文文本内容特征第37-39页
        3.3.1 博文文本相似度第37-38页
        3.3.2 话题迁移率特征第38-39页
    3.4 本章小结第39-40页
第四章 面向水军识别的用户特征向量模型构建第40-56页
    4.1 微博数据获取第40-43页
        4.1.1 新浪微博API第40-43页
        4.1.2 数据的获取第43页
    4.2 用户特征建模第43-55页
        4.2.1 微博博文预处理及用户行为特征获取第44-46页
        4.2.2 博文文本相似度特征模块第46-47页
        4.2.3 话题迁移率特征模块第47-50页
        4.2.4 特征选取和分析第50-55页
    4.3 本章小结第55-56页
第五章 基于逻辑回归算法的水军识别模型第56-66页
    5.1 基于逻辑回归算法的水军识别模型构建第56-62页
        5.1.1 水军的形式化定义第56页
        5.1.2 模型构建第56-62页
    5.2 实验结果分析第62-65页
        5.2.1 训练样本不同规模比对实验第62-63页
        5.2.2 交叉验证实验第63-64页
        5.2.3 多特征比对实验第64-65页
    5.3 本章总结第65-66页
第六章 总结与展望第66-68页
    6.1 本文总结第66-67页
    6.2 工作展望第67-68页
致谢第68-70页
参考文献第70-74页
作者在学期间取得的学术成果第74页

论文共74页,点击 下载论文
上一篇:面向新浪微博的智能自动回复技术的研究与实现
下一篇:面向无源RFID标签芯片的非易失存储器IP核关键技术研究