首页--文化、科学、教育、体育论文--科学、科学研究论文--科学研究理论论文--专利研究论文

大数据在专利信息分析中的应用研究

摘要第5-6页
Abstract第6-7页
第1章 绪论第14-22页
    1.1 论文研究背景和意义第14-15页
    1.2 国内外研究现状第15-18页
        1.2.1 大数据研究现状第15-17页
        1.2.2 专利信息分析研究现状第17-18页
    1.3 本文的主要工作第18-19页
    1.4 论文结构安排第19-22页
第2章 基于大数据理论的专利应用需求分析第22-28页
    2.1 大数据第22-23页
        2.1.1 大数据的基本概念第22页
        2.1.2 大数据的关键技术第22-23页
    2.2 专利文献第23-25页
        2.2.1 专利文献的特征第23-24页
        2.2.2 专利文献的处理难点第24-25页
    2.3 基于大数据理论的专利分析技术第25-26页
        2.3.1 基于大数据理论的专利文件系统第25页
        2.3.2 基于大数据理论的专利处理平台第25页
        2.3.3 基于大数据工具的专利数据挖掘第25-26页
    2.4 本章小结第26-28页
第3章 Hadoop及Map Reduce框架第28-36页
    3.1 Hadoop系统第28-30页
        3.1.1 Hadoop技术简介第28-29页
        3.1.2 Hadoop的master/slave架构第29-30页
    3.2 HDFS分布式文件系统第30-33页
        3.2.1 HDFS的组成结构第30-31页
        3.2.2 HDFS的工作流程第31-32页
        3.2.3 HDFS的特点第32-33页
    3.3 Map Reduce框架第33-35页
        3.3.1 Map Reduce并行编程模型第33页
        3.3.2 Map Reduce程序执行过程第33-34页
        3.3.3 Map Reduce的特点第34-35页
    3.4 本章小结第35-36页
第4章 文本聚类技术综述第36-44页
    4.1 文本聚类过程第36页
    4.2 文本预处理第36-37页
        4.2.1 文本分词第36-37页
        4.2.2 停用词过滤第37页
    4.3 文本特征降维第37-38页
    4.4 文本特征表示第38-39页
        4.4.1 布尔逻辑模型第38页
        4.4.2 向量空间模型第38-39页
    4.5 文本相似性度量第39-41页
        4.5.1 海明距离第39-40页
        4.5.2 欧几里得距离第40页
        4.5.3 马氏距离第40页
        4.5.4 余弦距离第40-41页
    4.6 文本聚类算法第41-42页
        4.6.1 基于划分的方法第41页
        4.6.2 基于层次的方法第41-42页
        4.6.3 基于密度的方法第42页
    4.7 本章小结第42-44页
第5章 基于Map Reduce的专利文本聚类第44-60页
    5.1 改进的K-Means文本聚类算法第44-47页
        5.1.1 初始质心的选择第44-46页
        5.1.2 改进算法的聚类过程第46-47页
    5.2 基于Map Reduce的专利文本特征表示第47-55页
        5.2.1 基于Map Reduce的TF-IDF权重计算第48-51页
        5.2.2 基于Map Reduce的专利文本特征选择第51-53页
        5.2.3 基于Map Reduce的专利文本特征表示第53-55页
    5.3 基于Map Reduce的聚类算法实现第55-59页
        5.3.1 基于Map Reduce的初始质心选择第55-58页
        5.3.2 基于Map Reduce的聚类过程第58-59页
    5.4 本章小结第59-60页
第六章 实验与结果分析第60-68页
    6.1 实验环境准备第60-61页
        6.1.1 Hadoop集群规划第60页
        6.1.2 Hadoop集群部署第60-61页
    6.2 数据集与评价指标第61-63页
        6.2.1 实验数据集第61页
        6.2.2 实验评价指标第61-63页
    6.3 聚类实验与结果分析第63-66页
        6.3.1 参数选取方法第63页
        6.3.2 聚类效果实验第63页
        6.3.3 并行性能实验第63-65页
        6.3.4 实验结果分析第65-66页
    6.4 本章小结第66-68页
总结与展望第68-70页
参考文献第70-74页
攻读硕士学位期间发表的论文第74-76页
致谢第76-77页
详细摘要第77-81页

论文共81页,点击 下载论文
上一篇:私募股权投资基金项目运作风险研究
下一篇:南宋叶适法律思想探析