首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

面向社会化媒体内容的若干聚类算法研究

摘要第4-6页
Abstract第6-8页
第1章 绪论第15-30页
    1.1 研究背景及意义第15-19页
        1.1.1 社会化媒体中的文本数据第16-17页
        1.1.2 社会化媒体中的用户关系数据第17-18页
        1.1.3 社会化媒体中的聚类方法第18-19页
    1.2 国内外研究现状及分析第19-24页
        1.2.1 基于HTML标签信息的网页内容聚类方法第19-20页
        1.2.2 文本数据聚类方法第20-22页
        1.2.3 用户主题和用户社区聚类方法第22-24页
        1.2.4 主要存在问题第24页
    1.3 研究工作及特色第24-28页
        1.3.1 主要研究内容第24-27页
        1.3.2 主要研究成果和创新第27-28页
    1.4 论文组织结构第28-30页
第2章 社会化媒体网页内容自动聚类算法第30-54页
    2.1 研究动机第30-31页
    2.2 语义模块和子树结构映射模型第31-36页
        2.2.1 DOM树的生成第31-32页
        2.2.2 对应关系假设第32页
        2.2.3 DOM树中的基本结构第32-36页
    2.3 TPS:一种基于DOM树子树结构的无监督网页分块算法第36-44页
        2.3.1 问题定义:基于子树结构的分割模型第37-38页
        2.3.2 TPS算法第38-40页
        2.3.3 实验验证第40-44页
    2.4 GPPS:基于图分割理论的无监督网页分块算法第44-52页
        2.4.1 图分割理论下的问题定义第44-45页
        2.4.2 分块算法中的限制第45-46页
        2.4.3 GPPS算法第46-48页
        2.4.4 实验验证第48-52页
    2.5 小结第52-54页
第3章 社会化媒体文本流中突发词聚类算法第54-71页
    3.1 研究动机第54-55页
    3.2 问题定义第55-56页
    3.3 基于主题的突发事件侦测第56-59页
        3.3.1 基于主题的突发事件侦测算法的概率框架第56页
        3.3.2 鉴别突发词第56-57页
        3.3.3 聚类突发词第57-59页
        3.3.4 计算事件的背景主题第59页
    3.4 实验结果及分析第59-67页
        3.4.1 数据集第60页
        3.4.2 事件聚类的评价指标第60-61页
        3.4.3 方法性能评价第61-62页
        3.4.4 事件发现可视化展示第62-66页
        3.4.5 通过主题追踪事件的变化第66-67页
    3.5 小结第67-71页
第4章 社会化媒体文本流中主题词聚类算法第71-86页
    4.1 研究动机第71-72页
    4.2 问题定义第72页
    4.3 主题事件侦测第72-76页
        4.3.1 主题事件侦测追踪算法的概率框架第72-73页
        4.3.2 主题对应的事件第73页
        4.3.3 聚类主题词第73-76页
        4.3.4 主题事件追踪第76页
    4.4 实验结果及分析第76-85页
        4.4.1 对比算法第76页
        4.4.2 数据集第76-77页
        4.4.3 事件聚类的评价指标第77页
        4.4.4 事件内聚性评估第77-78页
        4.4.5 事件发现可视化展示第78-81页
        4.4.6 追踪事件和检测事件的发展趋势第81-85页
    4.5 小结第85-86页
第5章 社会化媒体中文本和链接协同聚类模型第86-109页
    5.1 研究动机第86-88页
    5.2 作者-主题-社区模型第88-94页
        5.2.1 作者主题模型第88-89页
        5.2.2 主题-链接潜在狄利克雷划分模型第89-90页
        5.2.3 作者-主题-社区模型第90-91页
        5.2.4 模型推导和参数估计第91-94页
    5.3 实验结果及分析第94-108页
        5.3.1 人工数据集描述第94-95页
        5.3.2 真实数据集描述第95-97页
        5.3.3 性能评价指标第97-98页
        5.3.4 模拟数据实验第98-101页
        5.3.5 真实数据集上的性能比较第101-107页
        5.3.6 时间复杂度分析第107-108页
    5.4 小结第108-109页
结论第109-111页
参考文献第111-124页
附录A 用户的主题和社区协同聚类模型的相关证明第124-129页
    A.1 模型的似然函数第124页
    A.2 变分推导第124-126页
    A.3 参数估计第126-129页
附录B 突发词聚类的相关图表第129-131页
附录C 主题词聚类的相关图表第131-134页
攻读博士学位期间发表的论文及其他成果第134-137页
致谢第137-138页
个人简历第138页

论文共138页,点击 下载论文
上一篇:大视场人工复眼成像结构研究与实验
下一篇:双/多基地雷达密集多目标探测技术研究