面向多源数据的信息抽取方法研究

摘要	第5-6页
Abstract	第6页
第1章绪论	第9-14页
1.1 研究背景、目的与意义	第9-11页
1.1.1 研究背景	第9-10页
1.1.2 研究目的	第10页
1.1.3 研究意义	第10-11页
1.2 本文工作	第11-12页
1.3 本文结构	第12-14页
第2章相关工作	第14-25页
2.1 竞争对手和竞争挖掘	第14-17页
2.1.1 竞争对手分析	第14页
2.1.2 企业关系分析	第14-16页
2.1.3 企业信息抽取	第16-17页
2.2 信息抽取	第17-25页
2.2.1 历史与发展	第17-18页
2.2.2 文本挖掘	第18-20页
2.2.3 包装器归纳(Wrapper Induction)	第20-23页
2.2.4 Distant Supervision	第23-25页
第3章多源数据的信息抽取方法	第25-45页
3.1 问题描述及方法的提出	第25-28页
3.2 总体过程概要	第28-30页
3.2.1 竞争对手描述章节检测	第28-29页
3.2.2 多策略学习算法	第29-30页
3.3 竞争对手描述章节的检测	第30-35页
3.3.1 招股说明书预处理	第30-31页
3.3.2 竞争对手描述章节的检测方法	第31-35页
3.4 多策略学习算法	第35-45页
3.4.1 列表型语料的公司名抽取	第35-37页
3.4.2 表格型语料的公司名抽取	第37-41页
3.4.3 自由文本型语料的公司名抽取	第41-45页
第4章实验数据及结果评估	第45-50页
4.1 实验数据	第45页
4.2 结果分析与评估	第45-50页
4.2.1 每种类型语料中信息抽取的实验结果	第46-47页
4.2.2 使用多策略学习后的实验结果	第47-48页
4.2.3 与传统方法比较的实验结果	第48-50页
第5章总结及展望	第50-52页
5.1 本文总结	第50-51页
5.2 未来的工作	第51-52页
参考文献	第52-56页
致谢	第56-57页
攻读硕士学位期间发表的论文	第57页