首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向JSON半结构化文档的聚类技术研究

摘要第5-6页
Abstract第6页
第一章 绪论第9-15页
    1.1 研究背景第9页
    1.2 国内外研究现状第9-13页
        1.2.1 JSON半结构化文档研究现状第9-11页
        1.2.2 半结构化文档XML聚类技术的研究现状第11-13页
    1.3 研究思路和论文安排第13-15页
        1.3.1 研究思路第13页
        1.3.2 论文安排第13-15页
第二章 理论基础第15-24页
    2.1 半结构化文档第15-16页
        2.1.1 结构化、半结构化和非结构化文档第15-16页
        2.1.2 XML数据和JSON数据第16页
    2.2 JSON技术第16-20页
        2.2.1 JSON文档格式第16-18页
        2.2.2 JSON模式抽取第18-19页
        2.2.3 JSON与XML比较第19-20页
    2.3 聚类分析技术简介第20-24页
        2.3.1 聚类分析技术综述第20-22页
        2.3.2 K-Means聚类算法第22-24页
第三章 基于混合的JSON半结构化文档聚类算法第24-32页
    3.1 JSON半结构化文档向量表示第24-26页
        3.1.1 向量空间模型概念第24-25页
        3.1.2 JSON半结构化文档向量表示第25-26页
    3.2 文档相似性度量第26-27页
    3.3 JSON半结构化文档特征降维第27-28页
        3.3.1 TF-IDF方法第27-28页
        3.3.2 PCA方法第28页
    3.4 基于混合的K-Means聚类算法改进第28-32页
        3.4.1 前提假设第29页
        3.4.2 算法流程图第29-31页
        3.4.3 特点分析第31-32页
第四章 JSON半结构化文档的聚类分析与应用第32-46页
    4.1 政府开放数据来源——以美国为例第32-34页
        4.1.1 政府开放数据的背景分析第32-33页
        4.1.2 数据集获取与处理第33-34页
    4.2 聚类质量评价指标第34-36页
        4.2.1 内部质量指标第34-35页
        4.2.2 外部质量指标第35-36页
    4.3 政府开放数据的聚类有效性评价第36-44页
        4.3.1 实验方案第36-37页
        4.3.2 实验参数、结果及分析第37-43页
        4.3.3 总结分析第43-44页
    4.4 政府开放数据的类别数目k的确定第44-46页
        4.4.1 实验方案第44页
        4.4.2 实验参数、结果及分析第44-46页
第五章 JSON半结构化文档的聚类系统实现第46-56页
    5.1 系统流程图第46页
    5.2 系统模块设计第46-51页
        5.2.1 数据获取模块第46-48页
        5.2.2 预处理模块第48-49页
        5.2.3 向量表示模块第49-50页
        5.2.4 聚类方法模块第50-51页
    5.3 系统效果展示第51-56页
        5.3.1 模式的展示效果第52-53页
        5.3.2 主题的展示效果第53-56页
第六章 总结与展望第56-58页
    6.1 主要工作和结论第56-57页
    6.2 未来展望第57-58页
参考文献第58-62页
附录第62-73页
    附录A 美国政府开放门户网站爬虫核心代码第62-64页
    附录B 政府开放数据实验核心代码第64-73页
在攻读硕士期间发表论文和参加科研情况第73-74页
致谢第74页

论文共74页,点击 下载论文
上一篇:我国金融发展对居民消费的影响研究--基于城乡对比分析
下一篇:发展中大国城镇化影响消费需求的机理及实证研究