基于XML的信息抽取和集成模型的研究与设计
摘要 | 第1-4页 |
ABSTRACT | 第4-8页 |
第1章 引言 | 第8-17页 |
·背景介绍 | 第8-9页 |
·课题来源 | 第9页 |
·国内外研究现状 | 第9-15页 |
·国内信息抽取研究 | 第9-10页 |
·国外信息抽取研究 | 第10-15页 |
·论文主要工作 | 第15-16页 |
·论文主要结构 | 第16-17页 |
第2章 相关理论与技术综述 | 第17-32页 |
·XML技术 | 第17-20页 |
·XML的产生与发展 | 第17-18页 |
·XML相关标准 | 第18-19页 |
·XML主要技术特点 | 第19-20页 |
·信息抽取综述 | 第20-24页 |
·IE和IR | 第20-21页 |
·IE的历史 | 第21-22页 |
·IE系统的两大设计方法 | 第22页 |
·自由式,结构化和半结构化文本 | 第22-23页 |
·网页 | 第23-24页 |
·信息抽取系统的体系结构 | 第24页 |
·信息抽取中的关键技术 | 第24-28页 |
·命名实体识别 | 第24-25页 |
·句法分析 | 第25-26页 |
·篇章分析和推理 | 第26-27页 |
·知识获取 | 第27-28页 |
·分装器生成 | 第28-32页 |
·分装器 | 第28页 |
·分装器生成 | 第28-29页 |
·分装器的归纳学习 | 第29-32页 |
第3章 基于XML的信息抽取模型 | 第32-35页 |
·基于XML的信息抽取总体框图 | 第32-33页 |
·基于XML的信息抽取的层次结构 | 第33-35页 |
·信息抽取层 | 第33-34页 |
·中介层 | 第34页 |
·用户接口层 | 第34-35页 |
第4章 基于 XML的 Web信息抽取算法分析 | 第35-45页 |
·基于树型结构的Web抽取规则 | 第35-39页 |
·树型结构表示 Web文档 | 第35-36页 |
·算法总体思路 | 第36-38页 |
·抽取数据的XML输出 | 第38-39页 |
·基于 DOM的XML数据访问机制 | 第39-45页 |
·XML信息岛 | 第39-40页 |
·使用 DOM访问XML文档 | 第40-45页 |
第5章 XML与关系型数据集成 | 第45-54页 |
·XML数据的关系存储 | 第45-49页 |
·建立关系映射 | 第46-47页 |
·关系映射的相关模型 | 第47-49页 |
·基于 XML的Web查询处理 | 第49-54页 |
·现有的XML查询语句 | 第50-52页 |
·基于 XML的Web查询模式 | 第52-54页 |
第6章 信息抽取系统的设计与实现 | 第54-64页 |
·需求概述 | 第54-56页 |
·基于规则的自动抽取 | 第54-55页 |
·基于人工的手动抽取 | 第55页 |
·系统用例设计及分析 | 第55-56页 |
·原型系统框架设计 | 第56-61页 |
·系统功能模块设计 | 第56-57页 |
·系统体系结构设计 | 第57-58页 |
·功能模块的介绍 | 第58-61页 |
·原型系统的实现与评测 | 第61-64页 |
·系统平台与开发工具 | 第61页 |
·系统评测 | 第61-64页 |
第7章 结论 | 第64-65页 |
·论文总结 | 第64页 |
·工作展望 | 第64-65页 |
参考文献 | 第65-68页 |
致谢 | 第68-69页 |
攻读学位期间的研究成果 | 第69页 |