首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

社会化数据挖掘中的若干问题研究

摘要第3-6页
ABSTRACT第6-8页
主要符号对照表第15-17页
第一章 绪论第17-33页
    1.1 研究背景第17-21页
        1.1.1 微博第17-19页
        1.1.2 众包服务第19-20页
        1.1.3 用户评论第20-21页
    1.2 研究内容第21-30页
        1.2.1 优化众包序列标注第23-24页
        1.2.2 检测微博僵尸用户第24-26页
        1.2.3 检测微博中软广告第26-27页
        1.2.4 用户评论数据中的模式抽取第27-30页
    1.3 研究创新点第30-31页
    1.4 章节安排第31-33页
第二章 对于众包序列标注的研究第33-55页
    2.1 简介第33-35页
    2.2 聚合众包序列标注第35-46页
        2.2.1 问题抽象第35-36页
        2.2.2 众包序列标注聚合模型第36-43页
        2.2.3 主动学习聚合模型第43-46页
    2.3 实验第46-52页
        2.3.1 数据集第46页
        2.3.2 聚合模型评测第46-48页
        2.3.3 主动学习聚合模型评测第48-52页
    2.4 相关工作第52-55页
        2.4.1 提高众包标注的精度第52-53页
        2.4.2 提高众包标注的效率第53-55页
第三章 微博僵尸用户检测第55-79页
    3.1 简介第55-57页
    3.2 僵尸用户检测模型第57-64页
        3.2.1 问题抽象第57页
        3.2.2 概率模型第57-62页
        3.2.3 参数估计第62-64页
        3.2.4 时间复杂度分析第64页
    3.3 轻量级检测模型第64-67页
    3.4 实验第67-74页
        3.4.1 数据集合第68-69页
        3.4.2 特征抽取第69-71页
        3.4.3 分类精度评测第71-72页
        3.4.4 僵尸用户检测应用第72-74页
        3.4.5 轻量级检测模型第74页
    3.5 相关工作第74-79页
        3.5.1 万维网数据可靠性研究第75-76页
        3.5.2 微博数据的可靠性研究第76-79页
第四章 微博软广告检测第79-91页
    4.1 简介第79-81页
    4.2 软广告检测模型第81-86页
        4.2.1 问题描述第81-83页
        4.2.2 有约束的共聚类检测模型第83-86页
    4.3 实验第86-90页
        4.3.1 数据集合第86页
        4.3.2 聚类模型评测第86-88页
        4.3.3 聚类和分类的精度比较第88-90页
    4.4 相关工作第90-91页
        4.4.1 清除垃圾微博数据第90页
        4.4.2 清除扭曲的微博数据第90-91页
第五章 用户评论情感倾向性模式抽取第91-107页
    5.1 简介第91-92页
    5.2 迭代采样的频繁项集抽取方法第92-97页
        5.2.1 需要的迭代次数第94-96页
        5.2.2 模式评测第96-97页
        5.2.3 讨论第97页
    5.3 实验第97-102页
        5.3.1 数据集第98页
        5.3.2 实验结果第98-102页
    5.4 相关工作第102-107页
        5.4.1 具有情感倾向性的模式抽取第102-103页
        5.4.2 并行频繁项集挖掘第103-104页
        5.4.3 有区分度的频繁项集挖掘第104-105页
        5.4.4 频繁项集总结第105-107页
第六章 全文总结第107-109页
参考文献第109-127页
致谢第127-129页
攻读学位期间发表的学术论文目录第129-131页

论文共131页,点击 下载论文
上一篇:褪黑素对糖尿病视网膜病变的保护作用及机制研究
下一篇:基于硬件事务内存的内存计算系统可扩展性研究