首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

数据挖掘在网络传播质量信息的抓取及预处理中的研究与应用

摘要第5-7页
Abstract第7-8页
第1章 绪论第13-19页
    1.1 研究背景第13-15页
    1.2 研究现状第15-16页
    1.3 本文的研究意义第16-17页
    1.4 章节安排第17-19页
第2章 相关技术基础第19-29页
    2.1 分布式网络爬虫第19-20页
    2.2 数据挖掘技术第20-25页
        2.2.1 主题模型第20-22页
        2.2.2 贝叶斯分类器第22-23页
        2.2.3 支持向量机第23-24页
        2.2.4 决策树第24-25页
    2.3 Java Web技术第25-27页
    2.4 Hbase数据库技术第27-28页
    2.5 本章小结第28-29页
第3章 网络传播质量信息中数据挖掘技术研究第29-38页
    3.1 网络传播质量信息预处理研究第29-30页
    3.2 网络传播质量信息表示模型研究第30-31页
    3.3 网络传播质量信息聚类研究第31-34页
    3.4 网络传播质量信息分类研究与比较第34-37页
        3.4.1 网络传播质量信息分类评价方法第34-35页
        3.4.2 对比分类试验第35-36页
        3.4.3 实验结果与分析第36-37页
    3.5 本章小结第37-38页
第4章 网络传播质量信息分布式网络爬虫设计第38-45页
    4.1 整体设计目标第38页
    4.2 分布式网络爬虫系统设计第38-39页
    4.3 爬取策略设计第39-42页
    4.4 URL任务调度分配策略设计第42-44页
    4.5 本章小结第44-45页
第5章 数据挖掘技术在网络传播质量信息中的应用第45-49页
    5.1 网络传播质量信息数据的分词第45-46页
    5.2 网络传播质量信息数据相似度计算第46-47页
    5.3 网络传播质量信息数据聚类第47-48页
    5.4 网络传播质量信息数据分类第48页
    5.5 本章小结第48-49页
结论第49-51页
参考文献第51-56页
致谢第56-57页
附录A 分词器实现代码第57-59页
附录B 算法代码第59-62页
附录C 分类器实现代码第62-70页

论文共70页,点击 下载论文
上一篇:基于细粒度访问控制模型的商业保理系统设计与实现
下一篇:GF(31)域UOV签名算法及其向量化编程的优化与实现