首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于可重用组件的海量文本数据处理工具的设计与实现

摘要第5-6页
ABSTRACT第6-7页
第1章 绪论第11-14页
    1.1 研究背景及意义第11页
    1.2 论文研究的主要内容第11-12页
    1.3 论文结构第12-14页
第2章 相关理论与技术介绍第14-23页
    2.1 Hadoop第14-15页
        2.1.1 简介第14页
        2.1.2 HDFS第14-15页
    2.2 Spark第15-17页
        2.2.1 简介第15-16页
        2.2.2 Spark基础架构第16-17页
        2.2.3 Spark MLlib第17页
    2.3 文本挖掘技术第17-21页
        2.3.1 数据挖掘技术第17-18页
        2.3.2 中文分词第18页
        2.3.3 文本表示第18-19页
        2.3.4 文本聚类第19-21页
        2.3.5 文本分类第21页
    2.4 本章小结第21-23页
第3章 需求分析第23-31页
    3.1 整体需求第23-24页
    3.2 基本功能需求第24-29页
        3.2.1 海量文本数据处理组件第24-27页
        3.2.2 工作流第27-29页
    3.3 非功能性需求第29页
    3.4 本章小结第29-31页
第4章 关键问题研究第31-52页
    4.1 海量文本数据处理组件第31-43页
        4.1.1 海量文本数据的支持第31页
        4.1.2 组件的结构设计第31-36页
        4.1.3 组件的显示与设置第36-38页
        4.1.4 组件的运行第38-42页
        4.1.5 组件的具体类型第42-43页
    4.2 工作流第43-51页
        4.2.1 工作流的结构设计第43-46页
        4.2.2 工作流的显示与编辑第46-47页
        4.2.3 工作流的解析与运行第47-51页
    4.3 本章小结第51-52页
第5章 总体设计第52-61页
    5.1 整体结构第52-53页
    5.2 功能模块第53-58页
        5.2.1 功能模块介绍第53-57页
        5.2.2 工具各功能模块的交互第57-58页
    5.3 关键流程第58-60页
    5.4 本章小结第60-61页
第6章 关键模块的设计与实现第61-84页
    6.1 数据模块的设计与实现第61-64页
        6.1.1 海量数据管理第61-63页
        6.1.2 海量数据处理第63-64页
    6.2 组件模块的设计与实现第64-77页
        6.2.1 组件结构的设计与实现第64-65页
        6.2.2 组件实例化的设计与实现第65-67页
        6.2.3 数据获取组件的设计与实现第67-69页
        6.2.4 文本表示组件的设计与实现第69-73页
        6.2.5 文本分类组件的设计与实现第73-75页
        6.2.6 文本聚类组件的设计与实现第75-77页
    6.3 工作流模块的设计与实现第77-82页
        6.3.1 工作流结构的设计与实现第77-78页
        6.3.2 工作流解析的设计与实现第78-80页
        6.3.3 工作流运行的设计与实现第80-82页
    6.4 用户交互模块的设计与实现第82-83页
        6.4.1 组件的显示与编辑第82-83页
        6.4.2 工作流的显示与编辑第83页
    6.5 本章小结第83-84页
第7章 工具测试第84-99页
    7.1 工具底层平台搭建第84-85页
        7.1.1 Hadoop集群搭建第84-85页
        7.1.2 Spark框架搭建第85页
    7.2 单元测试第85-94页
    7.3 功能测试第94-97页
    7.4 非功能测试第97-98页
    7.5 本章小节第98-99页
第8章 总结与展望第99-101页
    8.1 论文总结第99页
    8.2 工作展望第99-101页
参考文献第101-103页
附录第103-104页
致谢第104-105页
攻读学位期间发表的学术论文目录第105页

论文共105页,点击 下载论文
上一篇:基于社交网络的国民安全威胁知识库建立与搜索研究
下一篇:医疗挂号系统微信公众号的设计与实现