基于特征模型的跨领域信息抽取方法研究
摘要 | 第6-8页 |
ABSTRACT | 第8-9页 |
第一章 绪论 | 第12-22页 |
1.1 研究背景 | 第12-15页 |
1.2 国内外研究现状概况 | 第15-17页 |
1.3 研究目的与意义 | 第17-19页 |
1.4 论文的主要研究内容 | 第19-20页 |
1.5 本文组织结构 | 第20-22页 |
第二章 Web信息抽取与相关方法 | 第22-30页 |
2.1 Web信息抽取方法概述 | 第22-25页 |
2.1.1 基于规则的Web信息抽取方法 | 第23-24页 |
2.1.2 基于统计的Web信息抽取方法 | 第24-25页 |
2.2 Web信息抽取的关键技术 | 第25-26页 |
2.3 跨领域信息抽取的方法 | 第26-28页 |
2.3.1 开放式信息抽取 | 第27页 |
2.3.2 利用半结构化信息抽取 | 第27页 |
2.3.3 基于本体的信息抽取 | 第27-28页 |
2.4 Web信息抽取的评价方法 | 第28-29页 |
2.5 小结 | 第29-30页 |
第三章 基于特征模型的跨领域信息抽取方法研究 | 第30-41页 |
3.1 概述 | 第30-31页 |
3.2 基于特征的Web信息抽取方法 | 第31-33页 |
3.2.1 将特征转化为规则 | 第31-32页 |
3.2.2 将特征参数化 | 第32-33页 |
3.3 特征模型 | 第33-35页 |
3.4 特征评价标准 | 第35-36页 |
3.5 特征组合的形式化表示 | 第36-37页 |
3.6 基于特征模型的跨领域信息抽取方法 | 第37-39页 |
3.6.1 基于特征模型的跨领域信息抽取理论框架 | 第37-38页 |
3.6.2 基于特征模型的跨领域信息抽取技术方案 | 第38-39页 |
3.7 小结 | 第39-41页 |
第四章 跨领域信息抽取方法中的特征选择方法研究 | 第41-67页 |
4.1 概述 | 第41-48页 |
4.1.1 特征选择算法相关工作 | 第42-44页 |
4.1.2 遗传算法 | 第44-47页 |
4.1.3 支持向量机 | 第47-48页 |
4.2 基于遗传算法的特征选择算法 | 第48-55页 |
4.2.1 种群初始化 | 第50-51页 |
4.2.2 机器学习交叉验证 | 第51-52页 |
4.2.3 遗传操作 | 第52-55页 |
4.2.4 停机标准 | 第55页 |
4.3 反馈机制 | 第55-57页 |
4.4 实验与分析 | 第57-66页 |
4.4.1 数据集 | 第57-58页 |
4.4.2 实验方案与步骤 | 第58-61页 |
4.4.3 实验结果与分析 | 第61-66页 |
4.5 小结 | 第66-67页 |
第五章 特征选择的优化 | 第67-83页 |
5.1 概述 | 第67-68页 |
5.2 冷启动问题 | 第68-76页 |
5.2.1 小样本初始特征向量空间 | 第69-71页 |
5.2.2 半随机半干预的初始化特征向量空间 | 第71-73页 |
5.2.3 全干预的初始化特征向量空间 | 第73-75页 |
5.2.4 三种初始化特征向量空间方法性能分析 | 第75-76页 |
5.3 特征向量保留问题 | 第76-82页 |
5.3.1 随机选择 | 第76-77页 |
5.3.2 直接排序选择 | 第77-79页 |
5.3.3 模拟赌盘选择 | 第79-81页 |
5.3.4 三种保留特征向量方法性能分析 | 第81-82页 |
5.4 小结 | 第82-83页 |
第六章 特征选择的提速 | 第83-93页 |
6.1 概述 | 第83-84页 |
6.2 遗传衰减 | 第84-87页 |
6.2.1 随机减半法 | 第85-86页 |
6.2.2 模拟赌盘减半 | 第86-87页 |
6.3 特征向量降维 | 第87-91页 |
6.3.1 特征去重法 | 第88-89页 |
6.3.2 特征去维法 | 第89-91页 |
6.4 小结 | 第91-93页 |
第七章 结论与展望 | 第93-96页 |
7.1 研究工作的创新性 | 第93-94页 |
7.2 研究工作的延展性 | 第94-96页 |
参考文献 | 第96-105页 |
作者在攻读硕士学位期间公开发表的论文 | 第105-106页 |
作者在攻读硕士学位期间所作的项目 | 第106-107页 |
致谢 | 第107页 |