基于领域本体的中文信息抽取研究--以植物物种多样性领域为例

摘要	第6-8页
ABSTRACT	第8-10页
1. 绪论	第14-25页
1.1 研究背景与意义	第14-15页
1.2 国内外研究现状	第15-21页
1.2.1 信息抽取研究的产生与发展	第15-16页
1.2.2 信息抽取的实现方法	第16-18页
1.2.3 生物物种多样性描述领域的信息抽取	第18-20页
1.2.4 领域本体构建	第20-21页
1.3 研究内容	第21-22页
1.4 研究创新点	第22-23页
1.5 文章组织结构	第23-25页
2 研究方案	第25-28页
2.1 研究方案架构	第25-26页
2.2 信息抽取方法	第26页
2.3 领域本体构建方法	第26-28页
3. 中文植物物种多样性本体构建	第28-49页
3.1 本体构建方案	第28-31页
3.2 构建所用资源	第31-42页
3.2.1 顶层本体架构——基本形式化本体(BFO)	第31-39页
3.2.1.1 BFO的结构	第31-38页
3.2.1.2 BFO体系中的关系	第38-39页
3.2.2 复用本体——植物本体(Plant Ontology,PO)	第39-42页
3.3 裁剪合并PO	第42-43页
3.4 增加实体与属性	第43页
3.5 添加关系	第43-45页
3.6 汉化术语	第45页
3.7 填充实例	第45-46页
3.8 目标本体体系	第46-49页
4 植物描述文本信息抽取实现	第49-63页
4.1 文本集构建	第49-52页
4.1.1 网页信息结构解析	第49-50页
4.1.2 相似度结合规则分块提取	第50-52页
4.2 领域字典导出	第52-53页
4.3 标注集设定	第53-55页
4.4 抽取规则	第55-61页
4.4.1 文本结构解析	第55-56页
4.4.2 规则调用逻辑	第56-59页
4.4.3 规则作用机制	第59页
4.4.4 隐藏信息探索识别	第59页
4.4.5 实例呈现	第59-61页
4.5 抽取信息结构化	第61-63页
5 实验及结果分析	第63-77页
5.1 实验样本	第63页
5.2 评测指标	第63页
5.3 实验方案	第63-65页
5.4 实验结果	第65-75页
5.4.1 整体抽取效果	第65-70页
5.4.2 科属间差异	第70-73页
5.4.3 部位间差异	第73-75页
5.5 存在的问题	第75-77页
6 研究总结	第77-79页
6.1 总结	第77-78页
6.2 不足与展望	第78-79页
参考文献	第79-84页
致谢	第84-86页
附录	第86页