第一章 绪论 | 第1-17页 |
·信息抽取概述 | 第10-11页 |
·信息抽取研究的发展历史 | 第11-15页 |
·本文的主要工作 | 第15-17页 |
第二章 规则自动获取方法综述 | 第17-23页 |
·自由式、结构化和半结构化文本 | 第17页 |
·单槽抽取和多槽抽取 | 第17-18页 |
·自由式文本的信息抽取规则表示及其自动获取方法 | 第18-23页 |
第三章 基于有限状态自动机的文本预处理 | 第23-31页 |
·文本预处理模块的主要功能 | 第23页 |
·总控程序的设计 | 第23-24页 |
·分析器 | 第24-25页 |
·自动机的语义动作 | 第25-26页 |
·知识库匹配 | 第25-26页 |
·类别知识库构建 | 第26页 |
·各类别自动机设计 | 第26-29页 |
·金钱 | 第26-27页 |
·时间 | 第27页 |
·网址 | 第27页 |
·电子邮件 | 第27-28页 |
·电话 | 第28页 |
·纯数字 | 第28页 |
·其他字符 | 第28-29页 |
·文本预处理模块总体流程 | 第29页 |
·小结 | 第29-31页 |
第四章 基于归纳逻辑编程的多槽信息抽取规则自动获取方法 | 第31-46页 |
·归纳逻辑编程与自然语言处理 | 第31-33页 |
·SRV算法简介 | 第33-34页 |
·搜索空间 | 第34-36页 |
·本算法的规则表示 | 第36-40页 |
·规则表示方式 | 第36-37页 |
·特征谓词集构造 | 第37-40页 |
·规则学习算法 | 第40-43页 |
·预处理 | 第40页 |
·模式关系拆分 | 第40-41页 |
·规则自动生成 | 第41-43页 |
·一个例子 | 第43-45页 |
·讨论 | 第45页 |
·小结 | 第45-46页 |
第五章 中文信息抽取系统设计 | 第46-53页 |
·系统工作流程 | 第46-47页 |
·CIPSEGSDK分词模块简介 | 第47页 |
·对比系统—零阶逻辑下的WHISK系统 | 第47-50页 |
·实验结果及讨论 | 第50-52页 |
·数据集和评价标准 | 第50页 |
·实验结果 | 第50-51页 |
·实验结果分析 | 第51-52页 |
·小结 | 第52-53页 |
第六章 总结 | 第53-55页 |
·研究工作总结 | 第53页 |
·未来工作展望 | 第53-55页 |
参考文献 | 第55-59页 |
致谢 | 第59-60页 |
攻读硕士学位期间发表的论文 | 第60页 |