首页--数理科学和化学论文--数学论文--代数、数论、组合理论论文--组合数学(组合学)论文--图论论文

基于频繁词集词共现网络的短文本聚类方法

致谢第5-6页
摘要第6-7页
ABSTRACT第7-8页
1 引言第11-16页
    1.1 研究背景第11-13页
    1.2 研究意义第13-14页
    1.3 研究现状第14-15页
    1.4 本文主要研究内容第15-16页
2 文本聚类相关技术第16-27页
    2.1 数据预处理第16-20页
        2.1.1 中文分词第17-18页
        2.1.2 去停用词第18页
        2.1.3 短文本数据第18-20页
    2.2 文本建模第20-22页
        2.2.1 布尔模型第20-21页
        2.2.2 向量空间模型第21页
        2.2.3 概率模型第21-22页
    2.3 文本相似度计算第22-23页
    2.4 传统聚类方法第23-26页
        2.4.1 基于划分的方法第23-24页
        2.4.2 基于层次的方法第24-25页
        2.4.3 基于密度的方法第25-26页
        2.4.4 谱聚类方法第26页
    2.5 本章小结第26-27页
3 基于频繁词集词共现网络的短文本聚类算法第27-45页
    3.1 算法思想第27页
    3.2 相关知识第27-30页
        3.2.1 社区发现第27-28页
        3.2.2 频繁项集挖掘第28-30页
    3.3 频繁词集词共现网络第30-31页
        3.3.1 频繁词集第30页
        3.3.2 频繁词集词共现网络第30-31页
    3.4 基于频繁词集词共现网络的短文本聚类算法第31-37页
    3.5 FWN算法实验与分析第37-38页
        3.5.1 实验环境第37页
        3.5.2 实验数据第37页
        3.5.3 实验评价指标第37-38页
        3.5.4 实验结果及分析第38页
    3.6 微博话题发现应用第38-44页
        3.6.1 相关背景第38-39页
        3.6.2 微博数据预处理第39-40页
        3.6.3 微博话题发现实验第40-44页
    3.7 本章小结第44-45页
4 搜索结果聚类第45-57页
    4.1 背景意义第45-46页
    4.2 相关工作第46页
    4.3 搜索结果聚类实验第46-49页
        4.3.1 实验数据第46-47页
        4.3.2 实验与对照第47-48页
        4.3.3 实验结果分析第48-49页
    4.4 百度新闻搜索结果聚类系统第49-53页
        4.4.1 数据获取模块第50-51页
        4.4.2 数据预处理模块第51-52页
        4.4.3 FWN短文本聚类第52-53页
    4.5 百度新闻搜索结果聚类系统第53-56页
        4.5.1 系统架构第53页
        4.5.2 系统开发环境第53-54页
        4.5.3 系统界面第54-56页
    4.6 本章小结第56-57页
5 结论第57-59页
    5.1 本文总结第57-58页
    5.2 存在问题以及工作展望第58-59页
参考文献第59-62页
作者简历及攻读硕士学位期间取得的研究成果第62-64页
学位论文数据集第64页

论文共64页,点击 下载论文
上一篇:miR-21-3p通过靶向调控组蛋白去乙酰化酶-8缓解心肌肥厚的作用及机制研究
下一篇:面向生态和航运的梯级水电站多目标发电优化调度研究