首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于信息抽取的实体知识库系统研究

致谢第5-6页
摘要第6-7页
ABSTRACT第7页
1 引言第10-16页
    1.1 研究背景及意义第10-11页
    1.2 国内外研究现状第11-14页
        1.2.1 国外信息抽取研究现状第11-12页
        1.2.2 中文信息抽取研究现状第12-14页
    1.3 论文主要内容第14-15页
    1.4 论文组织结构第15-16页
2 实体知识库系统及相关技术第16-36页
    2.1 系统整体结构第16-17页
    2.2 数据抓取部分第17-20页
        2.2.1 维基百科数据抓取第18-19页
        2.2.2 新闻数据抓取第19-20页
    2.3 信息抽取相关技术第20-35页
        2.3.1 命名实体抽取第20-30页
        2.3.2 实体关系抽取第30-35页
    2.4 本章小结第35-36页
3 基于CRF的命名实体识别第36-54页
    3.1 命名实体特征第36-38页
    3.2 命名实体识别模型第38-42页
        3.2.1 命名实体识别流程第39-40页
        3.2.2 地名实体识别校准第40-41页
        3.2.3 组织机构实体识别校准第41-42页
    3.3 CRF模型训练算法第42-43页
        3.3.1 CRF模型参数估计第42-43页
        3.3.2 CRF模型训练第43页
    3.4 特征集的构建第43-47页
        3.4.1 训练语料的转换第44页
        3.4.2 特征模板第44-47页
    3.5 特征选择第47-48页
    3.6 实验及结果第48-52页
        3.6.1 评价标准第48-49页
        3.6.2 实验及结果分析第49-52页
    3.7 本章小结第52-54页
4 无监督实体关系抽取第54-72页
    4.1 实体关系抽取模型第54-55页
    4.2 实体关系对筛选第55-56页
    4.3 关系特征词提取第56-59页
    4.4 关系特征词聚类第59-64页
        4.4.1 聚类技术第60-61页
        4.4.2 无监督关系抽取聚类方法第61-62页
        4.4.3 基于词向量的AP聚类第62-64页
    4.5 实验及结果第64-70页
        4.5.1 评价标准第65-66页
        4.5.2 实验及结果分析第66-70页
    4.6 本章小结第70-72页
5 总结及展望第72-74页
参考文献第74-76页
作者简历及攻读硕士学位期间取得的研究成果第76-80页
学位论文数据集第80页

论文共80页,点击 下载论文
上一篇:基于Android的培训机构业务管理平台的设计与实现
下一篇:全面禁牧以来牧民增收中存在的问题调查研究--以达茂旗巴彦哈日嘎查为例