首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

云环境下基于RIHDBSCAN的微博事件检测及跟踪

摘要第3-4页
ABSTRACT第4-5页
1 绪论第8-13页
    1.1 课题的研究背景第8-9页
        1.1.1 微博第8-9页
        1.1.2 云计算第9页
    1.2 课题研究的目的和意义第9-10页
    1.3 国内外研究现状第10-11页
    1.4 本论文研究内容与结构安排第11-13页
2 微博文本预处理第13-24页
    2.1 过滤无用信息第13-14页
    2.2 分词第14页
    2.3 权值计算方法第14-16页
        2.3.1 常用权值计算方法第14-15页
        2.3.2 FCF-DIDF第15-16页
    2.4 文本建模第16-19页
    2.5 特征降维第19-20页
    2.6 文本相似度计算第20-23页
        2.6.1 常用的相似度计算方法第20-22页
        2.6.2 欧氏距离与余弦相似度第22-23页
    2.7 本章小结第23-24页
3 聚类及云计算相关技术第24-42页
    3.1 聚类的主要算法第24-27页
    3.2 传统聚类在文本挖掘面临的困难第27-28页
    3.3 基于代表点的增量层次密度聚类第28-34页
        3.3.1 DBSCAN 相关定义第28-30页
        3.3.2 DBSCAN 算法的缺点第30页
        3.3.3 改进的算法 RIHDBSCAN第30-34页
        3.3.4 RIHDBSCAN 算法的性能第34页
    3.4 云计算关键技术第34-36页
    3.5 Hadoop 平台第36-41页
        3.5.1 HDFS 分布式文件系统第36-38页
        3.5.2 Mapreduce 编程模式第38-41页
    3.6 本章总结第41-42页
4 Hadoop 云环境下的微博事件检测跟踪模型第42-54页
    4.1 微博事件检测跟踪模型第42-43页
    4.2 并行化第43-47页
        4.2.1 文本过滤、分词并行第43-44页
        4.2.2 FCF-DIDF 权值并行计算第44-45页
        4.2.3 文本相似度并行计算第45-46页
        4.2.4 RIHDBSCAN 聚类并行第46-47页
    4.3 实验与结果分析第47-53页
        4.3.1 集群配置第47-48页
        4.3.2 实验数据第48-49页
        4.3.3 实验结果第49-53页
    4.4 本章总结第53-54页
5 总结与展望第54-56页
    5.1 全文总结第54页
    5.2 展望第54-56页
致谢第56-57页
参考文献第57-61页
附录第61页
    A.作者在攻读学位期间发表的论文目录第61页
    B.作者在攻读学位期间科研工作情况第61页

论文共61页,点击 下载论文
上一篇:基于GPU/多核CPU平台下并行计算的实时超分辨和立体视图生成
下一篇:PKI与TLS协议效率优化研究及软件实现