首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向海量互联网中文文本的实体关系抽取研究与实现

摘要第5-7页
ABSTRACT第7-8页
第一章 绪论第12-18页
    1.1 研究背景第12-13页
    1.2 研究意义第13页
    1.3 关系抽取的研究现状第13-15页
    1.4 研究内容第15-16页
    1.5 论文的组织结构第16-18页
第二章 相关技术第18-28页
    2.1 CRFs条件随机场第18-19页
    2.2 句法解析树第19-21页
    2.3 word2vec词向量第21-24页
    2.4 卷积神经网络CNN第24-25页
    2.5 循环神经网络LSTM第25-26页
    2.6 Hadoop第26-28页
第三章 基于条件随机场的中文开放式实体关系抽取C-COERE第28-44页
    3.1 引言第28-29页
    3.2 数据预处理第29-30页
    3.3 CRFs条件随机场标注第30-31页
        3.3.1 特征抽取和人工标注第30-31页
        3.3.2 模型训练与标注第31页
    3.4 SPTB关系三元组提取第31-33页
    3.5 后处理过滤第33-34页
    3.6 迭代式抽取第34-36页
    3.7 并行化算法PC-COERE第36-40页
        3.7.1 并行化预处理子过程第36-37页
        3.7.2 并行化关系元组提取子过程第37页
        3.7.3 并行化关系元组过滤子过程第37-38页
        3.7.4 并行化关系模式提取子过程第38-39页
        3.7.5 并行化模式匹配元组子过程第39-40页
    3.8 实验结果及分析第40-43页
        3.8.1 基于人工标注的数据集第40-42页
        3.8.2 基于无标注的大规模文本数据集第42页
        3.8.3 并行化算法对比实验第42-43页
    3.9 本章小结第43-44页
第四章 基于深度神经网络的中文开放式实体关系抽取第44-55页
    4.1 引言第44-45页
    4.2 候选关系三元组的生成与词的表示方法第45页
    4.3 基本特征第45-46页
    4.4 基于LSTM的元组级特征第46-48页
    4.5 基于CNN的句子级特征第48-49页
    4.6 输出层和模型训练第49-50页
    4.7 实验结果及分析第50-54页
        4.7.1 词向量与数据集第50-51页
        4.7.2 候选关系三元组第51-52页
        4.7.3 神经网络超参数设置第52-53页
        4.7.4 对比实验第53-54页
    4.8 本章小结第54-55页
第五章 实体关系类型自动构建技术的研究与实现第55-64页
    5.1 基于word2vec的词语相似度的度量第55-56页
    5.2 聚类算法第56-59页
        5.2.1 K-means聚类第56-57页
        5.2.2 层次聚类第57页
        5.2.3 基于密度的DBSCAN聚类第57-58页
        5.2.4 Affinity Propagation近邻传播聚类第58-59页
        5.2.5 谱聚类第59页
    5.3 实验结果及分析第59-62页
        5.3.1 数据集及评价标准第59-62页
        5.3.2 实验结果及分析第62页
    5.4 本章小结第62-64页
第六章 可视化的中文开放式实体关系抽取原型系统第64-70页
    6.1 需求分析第64-66页
    6.2 系统架构第66-67页
    6.3 系统演示第67-69页
    6.4 本章小结第69-70页
第七章 总结与展望第70-72页
    7.1 本文总结第70-71页
    7.2 展望第71-72页
参考文献第72-75页
致谢第75-77页
攻读硕士学位期间发表的论文第77页

论文共77页,点击 下载论文
上一篇:目标驱动的监控视频定位系统中人脸识别方法的设计与实现
下一篇:科技信息分类聚合系统的设计与实现