首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于层次语义结构的流式文本数据挖掘

摘要第4-7页
Abstract第7-9页
1 绪论第15-28页
    1.1 背景意义第15-17页
    1.2 研究现状第17-24页
        1.2.1 语义关系提取及概念层次构建第17-19页
        1.2.2 稀有类别检测及距离度量学习第19-22页
        1.2.3 主题模型第22-24页
    1.3 本文的主要工作第24-27页
    1.4 论文的结构第27-28页
2 基于复合语义距离的多路概念层次构建第28-57页
    2.1 相关工作第28-30页
        2.1.1 语义关系提取第28-29页
        2.1.2 层次聚类第29页
        2.1.3 概念层次相似度评估第29-30页
    2.2 多路领域概念层次构建第30-40页
        2.2.1 问题定义第30-31页
        2.2.2 整体过程第31-32页
        2.2.3 文本预处理第32页
        2.2.4 基于主题模型的关键字提取第32-33页
        2.2.5 语义关系提取及概念层次构建第33-40页
    2.3 概念层次评估标准第40-44页
    2.4 实验及结果分析第44-56页
        2.4.1 实验数据集第44页
        2.4.2 实验设定第44-46页
        2.4.3 实验结果第46-56页
    2.5 本章小结第56-57页
3 基于半监督层次聚类的稀有类别检测第57-88页
    3.1 相关工作第57-61页
        3.1.1 稀有类别检测第57-59页
        3.1.2 距离度量学习第59-60页
        3.1.3 密度聚类方法第60-61页
    3.2 基于相对距离约束的半监督核均值漂移算法第61-67页
        3.2.1 均值漂移聚类第61-62页
        3.2.2 基于核函数的均值漂移聚类第62-64页
        3.2.3 基于相对距离的核均值漂移聚类第64-67页
    3.3 基于层次化半监督密度聚类的稀有类别检测第67-76页
        3.3.1 整体框架第68-69页
        3.3.2 层次半监督密度聚类第69-70页
        3.3.3 聚类评价指标第70-72页
        3.3.4 主动学习集成策略和线索选择方法第72-74页
        3.3.5 混合的线索选择策略第74-75页
        3.3.6 时间复杂度分析第75-76页
    3.4 实验和结果分析第76-87页
        3.4.1 实验设置第76-78页
        3.4.2 线性映射情况下的结果第78-81页
        3.4.3 非线性映射情况下的结果第81-83页
        3.4.4 不同混合线索选择方法的效果第83-85页
        3.4.5 不同线索数据比例的影响第85-86页
        3.4.6 时间效率第86-87页
    3.5 本章小结第87-88页
4 基于在线层次主题模型的动态主题检测第88-118页
    4.1 相关工作第88-91页
    4.2 用于主题检测的层次在线NMF方法第91-105页
        4.2.1 基于NMF的主题检测第91页
        4.2.2 在线NMF方法第91-93页
        4.2.3 HONMF总体框架第93-95页
        4.2.4 HONMF方法细节第95-101页
        4.2.5 层次结构演化第101-104页
        4.2.6 时间复杂度第104-105页
    4.3 实验和结果分析第105-117页
        4.3.1 数据集第105-106页
        4.3.2 评估标准第106-107页
        4.3.3 对比方法第107-109页
        4.3.4 不同方法主题质量第109-111页
        4.3.5 不同方法的主题平滑度第111-112页
        4.3.6 主题层次演化第112-114页
        4.3.7 新兴主题检测效果第114-115页
        4.3.8 时间效率第115-117页
    4.4 本章小结第117-118页
5 基于语义关系的半监督层次在线主题检测框架第118-128页
    5.1 SSHONMF整体框架第118-119页
    5.2 基于语义关系的半监督层次在线非负矩阵分解方法第119-124页
        5.2.1 基于语义关系的词向量权重调整第119-120页
        5.2.2 线索文档选择和相似度度量学习第120-123页
        5.2.3 基于可变相似度度量函数的HONMF第123-124页
    5.3 实验与结果分析第124-127页
        5.3.1 实验设置第124-125页
        5.3.2 主题质量评估第125-126页
        5.3.3 r_A参数影响评估第126-127页
    5.4 本章小结第127-128页
6 总结与展望第128-133页
    6.1 总结第128-131页
    6.2 展望第131-133页
参考文献第133-144页
攻读博士学位期间主要的研究成果第144-145页
致谢第145页

论文共145页,点击 下载论文
上一篇:数字口腔可视化技术及系统开发
下一篇:基于用户行为和位置感知的边际服务加载优化研究