首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于领域本体的中文信息抽取研究--以植物物种多样性领域为例

摘要第6-8页
ABSTRACT第8-10页
1. 绪论第14-25页
    1.1 研究背景与意义第14-15页
    1.2 国内外研究现状第15-21页
        1.2.1 信息抽取研究的产生与发展第15-16页
        1.2.2 信息抽取的实现方法第16-18页
        1.2.3 生物物种多样性描述领域的信息抽取第18-20页
        1.2.4 领域本体构建第20-21页
    1.3 研究内容第21-22页
    1.4 研究创新点第22-23页
    1.5 文章组织结构第23-25页
2 研究方案第25-28页
    2.1 研究方案架构第25-26页
    2.2 信息抽取方法第26页
    2.3 领域本体构建方法第26-28页
3. 中文植物物种多样性本体构建第28-49页
    3.1 本体构建方案第28-31页
    3.2 构建所用资源第31-42页
        3.2.1 顶层本体架构——基本形式化本体(BFO)第31-39页
            3.2.1.1 BFO的结构第31-38页
            3.2.1.2 BFO体系中的关系第38-39页
        3.2.2 复用本体——植物本体(Plant Ontology,PO)第39-42页
    3.3 裁剪合并PO第42-43页
    3.4 增加实体与属性第43页
    3.5 添加关系第43-45页
    3.6 汉化术语第45页
    3.7 填充实例第45-46页
    3.8 目标本体体系第46-49页
4 植物描述文本信息抽取实现第49-63页
    4.1 文本集构建第49-52页
        4.1.1 网页信息结构解析第49-50页
        4.1.2 相似度结合规则分块提取第50-52页
    4.2 领域字典导出第52-53页
    4.3 标注集设定第53-55页
    4.4 抽取规则第55-61页
        4.4.1 文本结构解析第55-56页
        4.4.2 规则调用逻辑第56-59页
        4.4.3 规则作用机制第59页
        4.4.4 隐藏信息探索识别第59页
        4.4.5 实例呈现第59-61页
    4.5 抽取信息结构化第61-63页
5 实验及结果分析第63-77页
    5.1 实验样本第63页
    5.2 评测指标第63页
    5.3 实验方案第63-65页
    5.4 实验结果第65-75页
        5.4.1 整体抽取效果第65-70页
        5.4.2 科属间差异第70-73页
        5.4.3 部位间差异第73-75页
    5.5 存在的问题第75-77页
6 研究总结第77-79页
    6.1 总结第77-78页
    6.2 不足与展望第78-79页
参考文献第79-84页
致谢第84-86页
附录第86页

论文共86页,点击 下载论文
上一篇:意定监护制度研究
下一篇:基于SWAT和信息熵的非点源污染最佳管理措施的研究--以辽河上游为例