首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于开放存取的科研数据获取与专家相似度研究

摘要第4-5页
ABSTRACT第5页
第1章 绪论第13-22页
    1.1 引言第13-15页
    1.2 课题背景第15-18页
        1.2.1 国外Open Access现状第15-16页
        1.2.2 国内Open Access现状及问题第16-18页
    1.3 研究内容第18-20页
    1.4 论文组织第20-21页
    1.5 本章小结第21-22页
第2章 相关工作第22-37页
    2.1 专家领域发现和专家科研相似度综述第22-24页
        2.1.1 专家研究领域发现第22-23页
        2.1.2 专家间研究领域的相似度第23-24页
    2.2 TF-IDF综述及应用第24-25页
        2.2.1 概念第24页
        2.2.2 原理第24-25页
        2.2.3 应用第25页
    2.3 主题模型综述及应用第25-31页
        2.3.1 基础知识第26-29页
        2.3.2 LDA的简要介绍第29-30页
        2.3.3 主题模型的应用第30-31页
    2.4 词向量综述及应用第31-36页
        2.4.1 词向量研究背景第31-32页
        2.4.2 词向量模型简介第32-35页
        2.4.3 词向量模型应用第35-36页
    2.5 本章小结第36-37页
第3章 科研数据扩充与清洗第37-50页
    3.1 基于多数据源的论文元数据补全第39-44页
        3.1.1 论文数据来源第39-41页
        3.1.2 基于DOI属性的论文元数据补全第41-42页
        3.1.3 基于中英文标题的论文元数据补全第42-44页
    3.2 论文元数据的清洗和去重第44-47页
        3.2.1 论文元数据的清洗第44-45页
        3.2.2 论文元数据去重第45-47页
    3.3 科研数据扩充第47-49页
        3.3.1 论文数据的进一步扩充第47-48页
        3.3.2 期刊信息库的建立第48-49页
    3.4 本章小结第49-50页
第4章 基于主题模型的标签生成第50-72页
    4.1 科研兴趣标签简述第50-53页
        4.1.1 提取专家科研兴趣标签的意义第50-52页
        4.1.2 专家兴趣标签数据来源及表示第52-53页
    4.2 基于TD-IDF方法的专家标签提取第53-55页
        4.2.1 标准的TF-IDF生成专家标签第53-54页
        4.2.2 改进的TF-IDF生成专家标签第54-55页
    4.3 基于主题模型LDA的专家标签提取第55-58页
        4.3.1 非主题模型的缺陷第55-56页
        4.3.2 主要思想第56-57页
        4.3.3 参数设定第57-58页
    4.4 实验和结果第58-71页
        4.4.1 实验环境第58页
        4.4.2 实验数据相关第58-60页
        4.4.3 评估方法第60页
        4.4.4 实验结果第60-66页
        4.4.5 结果分析第66-71页
    4.5 本章小结第71-72页
第5章 基于词向量的专家相似度研究第72-86页
    5.1 专家相似度综述第73-75页
        5.1.1 专家相似度定义第73-74页
        5.1.2 计算专家相似度的意义第74页
        5.1.3 专家相似度(关联度)的方法归纳第74-75页
    5.2 基于词向量的专家相似度算法第75-77页
    5.3 模型介绍第77-79页
    5.4 实验设计和结果第79-85页
        5.4.1 数据源相关第79页
        5.4.2 实验方法第79-80页
        5.4.3 结果和分析第80-85页
    5.5 本章小结第85-86页
第6章 总结和展望第86-88页
    6.1 总结第86-87页
    6.2 展望第87-88页
参考文献第88-92页
致谢第92页

论文共92页,点击 下载论文
上一篇:参与介质中的无偏光子聚集方法
下一篇:智能数据可视化系统中自动化图表推导技术的设计与实现