首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

面向商业舆情的网络智能分析系统研究与实现

摘要第5-6页
ABSTRACT第6-7页
缩略词表第14-15页
第一章 绪论第15-21页
    1.1 研究背景及意义第15-17页
    1.2 国内外研究现状第17-19页
    1.3 主要研究内容第19-20页
    1.4 论文章节安排第20-21页
第二章 网络舆情系统关键技术分析第21-36页
    2.1 网络爬虫技术第21-24页
    2.2 文本预处理技术第24-27页
        2.2.1 网页内容提取技术第24页
        2.2.2 中文文本分词技术第24-27页
        2.2.3 文本信息停用词处理第27页
    2.3 文本向量表示与特征选择第27-29页
    2.4 文本相似度度量计算方法第29-31页
    2.5 文本分类与聚类技术第31-34页
        2.5.1 文本分类算法第31-32页
        2.5.2 文本聚类算法第32-33页
        2.5.3 聚类与分类效果评价标准第33-34页
    2.6 话题检测与追踪技术第34-36页
第三章 系统的需求分析与总体架构设计第36-44页
    3.1 系统概述第36-38页
        3.1.1 系统设计目标第36-37页
        3.1.2 系统需求与分析第37-38页
    3.2 系统的架构设计第38-42页
        3.2.1 系统的总体框架设计第38-40页
        3.2.2 系统的分层设计第40-42页
    3.3 系统的运行与流程介绍第42-43页
    3.4 本章小结第43-44页
第四章 文本的特征选择与处理技术第44-56页
    4.1 特征选择算法及分类第44-45页
    4.2 TF-IDF算法及其基本原理第45-46页
    4.3 基于强调因子的EM-NWTF算法第46-50页
    4.4 仿真验证分析第50-55页
    4.5 本章小结第55-56页
第五章 文本聚类技术第56-69页
    5.1 文本聚类方法的类型划分第56-58页
    5.2 典型的文本聚类算法第58-61页
        5.2.1 基于划分的K-means算法第58-59页
        5.2.2 基于划分的K-medoids算法第59页
        5.2.3 基于层次的BIRCH算法第59-60页
        5.2.4 基于层次的CURE算法第60页
        5.2.5 基于密度的DBSCAN算法第60-61页
    5.3 基于最小相似选择的MINITER-MEANS算法第61-62页
    5.4 仿真验证分析第62-68页
    5.5 本章小结第68-69页
第六章 舆情系统实验测试分析第69-85页
    6.1 分布式数据处理平台HADOOP概述第69-74页
        6.1.1 Map Reduce编程模型第69-71页
        6.1.2 HDFS机制第71-73页
        6.1.3 Mahout算法库第73-74页
    6.2 系统测试实验方案设计第74-77页
        6.2.1 实验数据第74-76页
        6.2.2 实验环境第76-77页
    6.3 系统平台搭建与运行测试第77-84页
        6.3.1 集群软件安装与文件配置第77-79页
        6.3.2 运行测试结果与数据分析第79-84页
    6.4 本章小结第84-85页
第七章 总结与展望第85-87页
    7.1 全文总结第85-86页
    7.2 前景展望第86-87页
致谢第87-88页
参考文献第88-93页
攻读硕士期间取得的研究成果第93-94页

论文共94页,点击 下载论文
上一篇:基于局部特征的运动目标跟踪算法的研究与实现
下一篇:基于图像的信息隐写与分析技术研究