摘要 | 第6-8页 |
ABSTRACT | 第8-10页 |
1. 绪论 | 第14-25页 |
1.1 研究背景与意义 | 第14-15页 |
1.2 国内外研究现状 | 第15-21页 |
1.2.1 信息抽取研究的产生与发展 | 第15-16页 |
1.2.2 信息抽取的实现方法 | 第16-18页 |
1.2.3 生物物种多样性描述领域的信息抽取 | 第18-20页 |
1.2.4 领域本体构建 | 第20-21页 |
1.3 研究内容 | 第21-22页 |
1.4 研究创新点 | 第22-23页 |
1.5 文章组织结构 | 第23-25页 |
2 研究方案 | 第25-28页 |
2.1 研究方案架构 | 第25-26页 |
2.2 信息抽取方法 | 第26页 |
2.3 领域本体构建方法 | 第26-28页 |
3. 中文植物物种多样性本体构建 | 第28-49页 |
3.1 本体构建方案 | 第28-31页 |
3.2 构建所用资源 | 第31-42页 |
3.2.1 顶层本体架构——基本形式化本体(BFO) | 第31-39页 |
3.2.1.1 BFO的结构 | 第31-38页 |
3.2.1.2 BFO体系中的关系 | 第38-39页 |
3.2.2 复用本体——植物本体(Plant Ontology,PO) | 第39-42页 |
3.3 裁剪合并PO | 第42-43页 |
3.4 增加实体与属性 | 第43页 |
3.5 添加关系 | 第43-45页 |
3.6 汉化术语 | 第45页 |
3.7 填充实例 | 第45-46页 |
3.8 目标本体体系 | 第46-49页 |
4 植物描述文本信息抽取实现 | 第49-63页 |
4.1 文本集构建 | 第49-52页 |
4.1.1 网页信息结构解析 | 第49-50页 |
4.1.2 相似度结合规则分块提取 | 第50-52页 |
4.2 领域字典导出 | 第52-53页 |
4.3 标注集设定 | 第53-55页 |
4.4 抽取规则 | 第55-61页 |
4.4.1 文本结构解析 | 第55-56页 |
4.4.2 规则调用逻辑 | 第56-59页 |
4.4.3 规则作用机制 | 第59页 |
4.4.4 隐藏信息探索识别 | 第59页 |
4.4.5 实例呈现 | 第59-61页 |
4.5 抽取信息结构化 | 第61-63页 |
5 实验及结果分析 | 第63-77页 |
5.1 实验样本 | 第63页 |
5.2 评测指标 | 第63页 |
5.3 实验方案 | 第63-65页 |
5.4 实验结果 | 第65-75页 |
5.4.1 整体抽取效果 | 第65-70页 |
5.4.2 科属间差异 | 第70-73页 |
5.4.3 部位间差异 | 第73-75页 |
5.5 存在的问题 | 第75-77页 |
6 研究总结 | 第77-79页 |
6.1 总结 | 第77-78页 |
6.2 不足与展望 | 第78-79页 |
参考文献 | 第79-84页 |
致谢 | 第84-86页 |
附录 | 第86页 |