基于事件框架的突发事件信息抽取
摘要 | 第4-5页 |
ABSTRACT | 第5-6页 |
1. 绪论 | 第11-17页 |
1.1 研究背景 | 第11-14页 |
1.1.1 应用背景 | 第11页 |
1.1.2 信息抽取简介 | 第11-12页 |
1.1.3 相关国际评测 | 第12-14页 |
1.2 研究现状 | 第14-15页 |
1.3 本文的研究目标与内容 | 第15-16页 |
1.4 章节安排 | 第16-17页 |
2. 事件框架中已有侧面的信息抽取 | 第17-57页 |
2.1 概念定义 | 第17-18页 |
2.2 事件时间的抽取 | 第18-34页 |
2.2.1 时间表达式的识别 | 第18-23页 |
2.2.2 相对时间的推测 | 第23-24页 |
2.2.3 报道时间的获取和报道援引现象 | 第24-25页 |
2.2.4 事件发生时间的判断 | 第25-34页 |
2.3 事件地点的抽取 | 第34-43页 |
2.3.1 对于地名识别的相关研究 | 第34页 |
2.3.2 地名的识别及层次关系确定 | 第34-38页 |
2.3.3 地名的规范化处理 | 第38-39页 |
2.3.4 事件发生地点的抽取 | 第39-43页 |
2.4 事件结果的抽取 | 第43-53页 |
2.4.1 突发事件的结果侧面 | 第43-45页 |
2.4.2 事件结果的模式匹配 | 第45-49页 |
2.4.3 事件结果的标准化 | 第49-53页 |
2.5 事件信息合并 | 第53-56页 |
2.5.1 信息合并的判断标准 | 第53-54页 |
2.5.2 信息合并的具体方法 | 第54-56页 |
2.6 事件框架信息抽取存在的问题 | 第56-57页 |
3. 事件的新侧面探测 | 第57-73页 |
3.1 概念定义 | 第57-58页 |
3.1.1 单个事件的特有新侧面 | 第57-58页 |
3.1.2 一类事件的共同新侧面 | 第58页 |
3.2 事件新侧面探测 | 第58-60页 |
3.2.1 已有侧面排除 | 第59-60页 |
3.2.2 聚类探测 | 第60页 |
3.3 侧面特征的表示 | 第60-63页 |
3.3.1 词对特征模型简介 | 第60-61页 |
3.3.2 词对的定义与选择 | 第61页 |
3.3.3 词对的生成算法 | 第61-62页 |
3.3.4 词对的权重计算 | 第62-63页 |
3.4 探测算法 | 第63-73页 |
3.4.1 基于潜在语义分析的聚类技术 | 第63-68页 |
3.4.2 聚类框架与各模块说明 | 第68-73页 |
4. 系统的实现 | 第73-79页 |
4.1 系统界面 | 第73-74页 |
4.2 系统概述 | 第74-75页 |
4.3 各模块说明 | 第75-79页 |
4.3.1 文本预处理 | 第75-76页 |
4.3.2 侧面特征词生成 | 第76页 |
4.3.3 侧面识别 | 第76-77页 |
4.3.4 事件时间、地点的抽取 | 第77页 |
4.3.5 事件结果的抽取 | 第77页 |
4.3.6 新侧面选择 | 第77页 |
4.3.7 片断摘要 | 第77页 |
4.3.8 框架侧面合并 | 第77-79页 |
5. 实验结果与分析 | 第79-93页 |
5.1 实验设置 | 第79页 |
5.2 评测指标 | 第79-80页 |
5.3 实验结果与分析 | 第80-93页 |
5.3.1 子事件分离的结果 | 第80-82页 |
5.3.2 事件地点的抽取结果 | 第82-84页 |
5.3.3 事件结果的抽取结果 | 第84-88页 |
5.3.4 新侧面探测结果 | 第88-93页 |
6. 总结与展望 | 第93-95页 |
6.1 总结 | 第93页 |
6.2 未来工作展望 | 第93-95页 |
参考文献 | 第95-98页 |
致谢 | 第98-99页 |
攻读硕士学位期间已发表的学术论文 | 第99页 |