首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于微博数据挖掘的舆情监测与分析平台研究与实现

摘要第5-6页
Abstract第6-7页
第1章 绪论第11-19页
    1.1 论文研究的目的和意义第11-13页
    1.2 国内外研究现状第13-16页
        1.2.1 国内外舆情监测研究现状第13-14页
            1.2.1.1 国外舆情的研究现状第13页
            1.2.1.2 国内舆情的研究现状第13-14页
        1.2.2 针对海量信息的数据挖掘研究及发展趋势第14-16页
            1.2.2.1 数据挖掘研究现状第14-15页
            1.2.2.2 数据挖掘的发展趋势第15-16页
    1.3 研究内容和研究目标第16-17页
    1.4 论文的章节安排第17-19页
第2章 相关技术理论研究第19-31页
    2.1 信息提取技术第19-23页
        2.1.1 针对微博开放平台API爬取信息第19-20页
        2.1.2 网络爬虫技术第20-23页
            2.1.2.1 网页搜索策略第21-23页
            2.1.2.2 相关的开源爬虫框架第23页
    2.2 数据挖掘理论基础第23-25页
        2.2.1 数据挖掘概念第23-24页
        2.2.2 数据挖掘过程第24-25页
        2.2.3 数据挖掘方法第25页
    2.3 中文分词第25-26页
    2.4 数据仓库DW技术第26-31页
        2.4.1 DW主要特点第26-28页
        2.4.2 DW数据组织第28-29页
            2.4.2.1 DW数据组织结构第28-29页
            2.4.2.2 DW数据组织形式第29页
        2.4.3 DW体系结构第29-31页
第3章 舆情监测与分析平台模型设计第31-45页
    3.1 舆情监测与分析需求分析第31-35页
        3.1.1 功能需求分析第31-35页
        3.1.2 非功能需求第35页
    3.2 舆情监测与分析平台总体设计第35-37页
        3.2.1 系统总体流程第35页
        3.2.2 系统体系结构第35-37页
    3.3 信息采集功能研究第37-41页
    3.4 基于K-means算法和词共现度的信息分析功能研究第41-43页
        3.4.1 K-means算法第42页
        3.4.2 词共现法第42-43页
    3.5 舆情展示功能研究第43-45页
第4章 系统实现第45-69页
    4.1 信息采集功能实现第45-53页
        4.1.1 微博模拟登录第45-51页
            4.1.1.1 微博模拟登录分析过程第45-49页
            4.1.1.2 微博模拟登录实现第49-51页
        4.1.2 信息采集第51-53页
    4.2 信息分析功能实现第53-63页
        4.2.1 数据预处理第53-58页
        4.2.2 主题词抽取第58-61页
            4.2.2.1 词频统计与排序第58-60页
            4.2.2.2 计算权重第60-61页
        4.2.3 基于K-means和词共现法的主题词聚类第61-63页
    4.3 舆情展示实现第63-69页
        4.3.1 系统环境第63-64页
        4.3.2 舆情展示功能实现第64-69页
            4.3.2.1 系统界面第64页
            4.3.2.2 舆情分析实现第64-65页
            4.3.2.3 舆情趋势分析第65-69页
第5章 系统测试第69-73页
第6章 总结与展望第73-75页
参考文献第75-78页
致谢第78页

论文共78页,点击 下载论文
上一篇:高校实验室管理系统的设计与实现
下一篇:分布式视频爬虫与相似音频检索