首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于主题的文本挖掘及可视化系统研究与实现

摘要第5-6页
ABSTRACT第6-7页
符号对照表第11-12页
缩略语对照表第12-16页
第一章 绪论第16-24页
    1.1 研究背景第16-17页
    1.2 国内外研究现状第17-20页
        1.2.1 主题分类技术研究现状第17-18页
        1.2.2 大数据处理技术现状第18-20页
    1.3 论文研究内容与创新点第20-21页
    1.4 论文组织结构第21-24页
第二章 数据采集与预处理技术第24-32页
    2.1 数据爬虫第24-27页
        2.1.1 定向爬虫第24-26页
        2.1.2 网页信息提取第26-27页
        2.1.3 数据持久化第27页
    2.2 文本预处理第27-29页
        2.2.1 中文分词第28-29页
        2.2.2 噪声过滤第29页
    2.3 数据表示模型第29-30页
    2.4 本章小结第30-32页
第三章 主题分类算法研究第32-48页
    3.1 文本分类第32-36页
        3.1.1 TF-IDF算法第33页
        3.1.2 TextRank算法第33-34页
        3.1.3 余弦相似性第34-35页
        3.1.4 K-means算法第35-36页
    3.2 主题分类第36-39页
        3.2.1 浅层语义分析算法第37-38页
        3.2.2 概念浅层语义分析算法第38-39页
    3.3 隐含狄利克雷分布算法第39-44页
        3.3.1 LDA中的概率分布第39-40页
        3.3.2 文档生成过程第40-42页
        3.3.3 LDA模型第42-44页
    3.4 改进主题分类算法第44-46页
    3.5 实验设计与算法对比第46-47页
    3.6 本章小结第47-48页
第四章 主题分类的实际应用第48-60页
    4.1 系统架构设计概述第48-52页
        4.1.1 数据库结构简述第49-50页
        4.1.2 爬虫组件设计第50-51页
        4.1.3 数据预处理组件设计第51页
        4.1.4 主题分类算法组件设计第51-52页
    4.2 数据可视化与分析第52-55页
        4.2.1 数据可视化概述第52-54页
        4.2.2 可视化分析第54-55页
    4.3 Web展示系统第55-58页
        4.3.1 Django框架第56-57页
        4.3.2 系统开发概述第57-58页
    4.4 本章小结第58-60页
第五章 大数据下的主题分类应用第60-76页
    5.1 大数据技术与Hadoop第60-64页
        5.1.1 分布式存储HDFS第61-62页
        5.1.2 分布式计算MapReduce第62-64页
    5.2 大数据处理系统第64-69页
        5.2.1 集群搭建第65-67页
        5.2.2 词频统计第67-69页
    5.3 主题算法的分布式研究第69-73页
        5.3.1 TF-IDF算法分布式化第70-72页
        5.3.2 LDA算法分布式化第72-73页
    5.4 本章小结第73-76页
第六章 总结与展望第76-78页
参考文献第78-82页
致谢第82-84页
作者简介第84-85页

论文共85页,点击 下载论文
上一篇:低照度图像增强方法的研究与应用
下一篇:三余度飞控计算机硬件平台的设计与实现