首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

启发式的快速个人博客聚类技术研究和实现

摘要第4-5页
Abstract第5页
第1章 绪论第11-15页
    1.1 课题背景第11-13页
    1.2 本文工作第13-14页
    1.3 本文组织第14页
    1.4 本文小结第14-15页
第2章 相关工作第15-22页
    2.1 文本聚类第15-16页
    2.2 文本特征提取第16-18页
        2.2.1 文档频数特征选择第16-17页
        2.2.2 单词权特征选择第17页
        2.2.3 单词熵特征选择第17页
        2.2.4 主题特征选择第17-18页
    2.3 类别描述第18-20页
        2.3.1 基于统计的类别描述第18-19页
        2.3.2 基于外源数据的类别描述第19页
        2.3.3 基于聚类过程的类别描述第19-20页
    2.4 单词相似度计算第20-21页
        2.4.1 潜在语义分析方法(LSA,Latent Semantic Anslysis)第20页
        2.4.2 利用本体知识计算第20-21页
        2.4.3 利用大规模的语料计算第21页
    2.5 本章小结第21-22页
第3章 问题描述及数据模型定义第22-26页
    3.1 问题描述第22-25页
    3.2 数据模型定义第25页
    3.3 本章小结第25-26页
第4章 基于时间顺序兴趣集的用户相似度计算第26-39页
    4.1 用户相似度模型第26页
    4.2 用户相似度计算框架第26-31页
        4.2.1 兴趣集相似度第27-28页
        4.2.2 兴趣集序列相似度第28-31页
        4.2.3 用户相似度第31页
    4.3 分布式的单词相似度计算第31-38页
        4.3.1 单词相似度定义第32页
        4.3.2 单词相似度计算第32-38页
    4.4 本章小结第38-39页
第5章 启发式的个人博客聚类第39-50页
    5.1 启发式的相似内容获取第39-44页
        5.1.1 类别表示源数据获取第40-41页
        5.1.2 基于目标博主的相似博客获取第41-44页
    5.2 综合特征生成第44-46页
        5.2.1 单词熵提取文本特征第44-45页
        5.2.2 基于LDA的主题特征第45页
        5.2.3 综合特征第45-46页
    5.3 基于博客平台数据的半自动化聚类簇描述第46-49页
    5.4 本章小结第49-50页
第6章 系统设计与实现第50-56页
    6.1 系统结构第50-51页
    6.2 启发式数据搜索爬取模块第51-52页
        6.2.1 启发式离线搜索数据爬取模块第51页
        6.2.2 启发式在线搜索数据爬取模块第51-52页
    6.3 类别描述求解模块第52-53页
    6.4 相似词计算模块第53页
    6.5 用户相似度计算模块第53-54页
    6.6 聚类模块第54-55页
    6.7 本章小结第55-56页
第7章 实验结果及分析第56-64页
    7.1 聚类评价方法第56-57页
    7.2 实验结果及结果分析第57-63页
        7.2.1 启发式个人博客聚类算法的比较实验第57-62页
        7.2.2 聚类簇描述的实验第62-63页
    7.3 本章小结第63-64页
第8章 总结和展望第64-66页
    8.1 本文主要工作和贡献第64页
    8.2 未来研究工作展望第64-66页
参考文献第66-70页
致谢第70页

论文共70页,点击 下载论文
上一篇:带流量约束的星型图背包问题
下一篇:图像方向功率谱理论及其应用