首页--文化、科学、教育、体育论文--科学、科学研究论文--情报学、情报工作论文--情报资料的处理论文--情报资料的分析和研究论文

基于多知识库科技报告术语实体链接研究

摘要第6-7页
Abstract第7-8页
1. 绪论第11-17页
    1.1. 研究背景、目的及意义第11-12页
    1.2. 国内外研究现状第12-15页
        1.2.1. 科技报告研究现状第12-13页
        1.2.2. 实体链接研究现状第13-15页
    1.3. 本文的主要研究内容及组织结构第15-17页
        1.3.1. 本文的主要研究内容第15-16页
        1.3.2. 本文组织结构第16-17页
2. 科技报告新词发现方法研究第17-25页
    2.1. 新词发现概述第17-19页
        2.1.1. 相关理论第17-18页
        2.1.2. 新词发现基本流程第18-19页
    2.2. 数据预处理第19-21页
        2.2.1. 中文分词第20页
        2.2.2. 停用词过滤第20-21页
    2.3. 候选词串抽取第21-22页
        2.3.1. 组合词串筛选第21-22页
        2.3.2. 频繁词串的抽取第22页
    2.4. 新词发现第22-24页
        2.4.1. 统计特征的选择第23页
        2.4.2. 综合特征判定指标第23-24页
    2.5. 本章小结第24-25页
3. 术语知识库构建第25-34页
    3.1. 术语知识库构建相关技术第25-29页
        3.1.1. 信息采集技术第25-26页
        3.1.2. 数据清洗技术第26-27页
        3.1.3. 信息组织技术第27-28页
        3.1.4. 信息存储技术第28-29页
    3.2. 数据采集与预处理第29-30页
    3.3. 信息抽取第30-32页
    3.4. 数据存储第32-33页
    3.5. 本章小结第33-34页
4. 基于多知识库的术语实体链接方法第34-45页
    4.1. 文本再分词第35页
    4.2. 训练语料库第35-37页
    4.3. 候选术语实体获取第37-40页
        4.3.1. 实体识别方法简介第37-39页
        4.3.2. 基于条件随机场的候选术语实体获取第39-40页
    4.4. 候选术语实体链接研究第40-44页
        4.4.1. 语义相似度分析第40-42页
        4.4.2. 基于多知识库的实体链接方法第42-44页
    4.5. 实体链接效果评价第44页
    4.6. 本章小结第44-45页
5. 科技报告实体识别系统实现及性能测试第45-55页
    5.1. 系统数据来源及开发环境第45页
        5.1.1. 实验数据来源第45页
        5.1.2. 系统开发环境第45页
    5.2. 系统模块的实现第45-52页
        5.2.1. 数据预处理模块第45-48页
        5.2.2. 新词发现模块第48-50页
        5.2.3. 候选实体获取模块第50-51页
        5.2.4. 实体链接模块第51-52页
    5.3. 系统测试结果对比及分析第52-54页
    5.4. 本章小结第54-55页
6. 总结与展望第55-57页
    6.1. 全文总结第55页
    6.2. 下一步工作第55-57页
参考文献第57-61页
致谢第61页

论文共61页,点击 下载论文
上一篇:中国西部地区重症医学科脓毒症流行病学研究
下一篇:吴茱萸碱及其衍生物抑制PI3K/AKT通路诱导小细胞肺癌细胞凋亡