面向信息抽取的命名实体识别与模板获取技术研究

声明	第1-5页
摘要	第5-7页
ABSTRACT	第7-9页
目录	第9-12页
第一章前言	第12-20页
1．1 信息抽取概述	第12-13页
1．2 本文研究背景与意义	第13-18页
1．3 本文研究工作概述及论文结构	第18-20页
第二章统计和规则相结合的人名识别	第20-28页
2．1 人名及其前后缀引导词的统计分析	第20-23页
2．1．1 定义	第21-22页
2．1．2 统计分析	第22-23页
2．2 识别方法	第23-26页
2．2．1 人名识别的预处理	第23-24页
2．2．2 算法	第24-25页
2．2．3 统计的方法	第25-26页
2．2．4 规则的方法	第26页
2．2．5 不带姓氏的人名的识别和外国人名的识别	第26页
2．3 实验结果及分析	第26-27页
2．3．1 实验结果	第26-27页
2．3．2 分析	第27页
2．4 本章小结	第27-28页
第三章机构名的识别与CO-TRAINING机器学习方法的应用	第28-39页
3．1 机构名分类及其特征分析	第28-30页
3．2 采用Co-Training的方法构造机构名知识库	第30-35页
3．2．1 机构名知识库	第30-32页
3．2．2 Co-Training方法	第32页
3．2．3 基于Co-Training的中文机构名资源自动获取方法	第32-35页
3．3 统计和规则相结合的中文机构名识别方法	第35-37页
3．3．1 统计和规则相结合的机构名识别模型	第35-36页
3．3．2 算法描述	第36-37页
3．4 实验结果与分析	第37-38页
3．5 本章小结	第38-39页
第四章基于相似计算的模板自动获取	第39-48页
4．1 基于相似计算的模板自动获取方法	第40-45页
4．1．1 相关定义	第40-41页
4．1．2 模板的表示与同义词资源的建立	第41页
4．1．3 预处理	第41-42页
4．1．4 获取候选模板	第42页
4．1．5 模板相似计算模型	第42-43页
4．1．6 模板筛选	第43-44页
4．1．7 算法	第44-45页
4．2 实验与分析	第45-47页
4．2．1 实验1	第45页
4．2．2 实验2	第45-46页
4．2．3 实验3	第46页
4．2．4 讨论	第46-47页
4．3 本章小结	第47-48页
第五章中文信息抽取系统的设计	第48-57页
5．1 信息抽取系统简介	第48页
5．2 中文信息抽取系统的设计	第48-49页
5．3 中文信息抽取系统的实现技术	第49-56页
5．3．1 文本预处理	第49-52页
5．3．2 命名实体识别	第52-53页
5．3．3 模板解析	第53-56页
5．3．4 数据存储	第56页
5．4 本章小结	第56-57页
第六章结束语	第57-59页
6．1 研究工作总结	第57页
6．2 研究工作的前景	第57-58页
6．3 未来的研究工作	第58-59页
参考文献	第59-62页
致谢	第62-63页
攻读硕士学位期间发表的论文	第63页