首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于微博的热门话题提取与利用研究

摘要第5-6页
Abstract第6页
第1章 绪论第10-14页
    1.1 背景与意义第10-11页
    1.2 国内外的研究现状第11-13页
    1.3 论文总体框架第13-14页
第2章 文本信息处理的相关技术第14-22页
    2.1 微博信息采集技术第14-16页
        2.1.1 微博信息的获取第14-15页
        2.1.2 微博信息的提取第15-16页
    2.2 文本预处理第16-18页
        2.2.1 中文分词技术第16-17页
        2.2.2 微博集合的选择与噪声处理第17-18页
    2.3 文本相似度计算第18-20页
        2.3.1 余弦相似性第19页
        2.3.2 编辑距离第19页
        2.3.3 最长公共子序列第19-20页
    2.4 文本聚类算法第20-21页
        2.4.1 分割式聚类算法第20页
        2.4.2 结构式聚类算法第20页
        2.4.3 概率密度聚类算法第20-21页
    2.5 本章小结第21-22页
第3章 文本相似度计算第22-36页
    3.1 噪音去除以及分句处理第22-24页
    3.2 编辑距离第24-27页
        3.2.1 编辑距离的定义第24页
        3.2.2 编辑距离的性质与计算方法第24-25页
        3.2.3 构造编辑距离匹配关系矩阵第25-26页
        3.2.4 通过编辑距离计算相似度第26-27页
    3.3 加入交换的编辑距离算法第27-29页
        3.3.1 块交换编辑距离第28页
        3.3.2 词交换编辑距离第28-29页
    3.4 实验第29-35页
        3.4.1 实验数据第30页
        3.4.2 实验设计第30-31页
        3.4.3 实验结果与分析第31-35页
    3.5 本章小结第35-36页
第4章 微博话题聚类第36-49页
    4.1 层次聚类算法第36-37页
        4.1.1 自顶向下方法第37页
        4.1.2 自顶向下方法第37页
        4.1.3 聚类法的选择第37页
    4.2 并查集算法第37-42页
        4.2.1 并查集的快速查找算法第38-39页
        4.2.2 并查集的快速合并算法第39-40页
        4.2.3 并查集快速合并算法的改进第40-42页
    4.3 基于句子相同相似的聚类算法第42-44页
    4.4 实验第44-48页
        4.4.1 实验数据第44-45页
        4.4.2 实验设计第45页
        4.4.3 实验结果与分析第45-48页
    4.5 本章小结第48-49页
第5章 话题提取系统的设计与实现第49-56页
    5.1 话题提取系统设计第49-50页
    5.2 话题提取系统实现第50页
    5.3 系统结果展示第50-55页
    5.4 小结第55-56页
第6章 总结与展望第56-58页
    6.1 工作总结第56页
    6.2 工作展望第56-58页
致谢第58-59页
参考文献第59-62页
硕士研究生期间的主要学术成果第62页

论文共62页,点击 下载论文
上一篇:云南保山西邑铅锌矿床地质特征和流体包裹体研究
下一篇:内蒙古呼包盆地As-F病害区生态环境地球化学研究--以只几梁乡、永圣域乡为例