基于条件随机场的两阶段中文微博命名实体识别研究
摘要 | 第1-5页 |
Abstract | 第5-9页 |
1 绪论 | 第9-18页 |
·课题背景和意义 | 第9-12页 |
·命名实体识别的发展历程及研究现状 | 第12-16页 |
·命名实体识别的发展历程 | 第12-13页 |
·命名实体识别研究现状 | 第13-16页 |
·本文的研究内容和重点 | 第16页 |
·本文的结构安排 | 第16-18页 |
2 命名实体识别定义及主要方法介绍 | 第18-24页 |
·命名实体识别定义 | 第18-19页 |
·命名实体识别的主要方法 | 第19-23页 |
·基于词典知识库的方法 | 第20页 |
·基于种子概念的方法 | 第20页 |
·基于语言学规则的方法 | 第20-21页 |
·基于统计机器学习的方法 | 第21-22页 |
·混合方法 | 第22-23页 |
·小结 | 第23-24页 |
3 两阶段的中文微博文本命名实体识别方法 | 第24-43页 |
·文本正规化 | 第24-28页 |
·微博文本的特点 | 第24-26页 |
·微博文本正规化标准 | 第26-28页 |
·基于条件随机场的命名实体边界检测 | 第28-40页 |
·条件随机场模型 | 第29-32页 |
·特征选取 | 第32-38页 |
·特征模板 | 第38-40页 |
·基于条件随机场的命名实体类型判定 | 第40-43页 |
·命名实体识别后处理 | 第40-41页 |
·特征选择及特征模板 | 第41-43页 |
4 实验与分析 | 第43-57页 |
·实验准备 | 第43-44页 |
·实验所需的工具和软件 | 第43页 |
·语料库准备 | 第43-44页 |
·评价标准 | 第44-45页 |
·实验过程和结果分析 | 第45-52页 |
·实验语料正规化预处理 | 第45-47页 |
·条件随机场的训练 | 第47-52页 |
·实验结果分析和比较 | 第52-57页 |
·预处理操作对命名实体边界识别的影响 | 第52-53页 |
·特征选择对命名实体边界识别的影响 | 第53-54页 |
·后处理操作对命名实体识别的影响 | 第54-55页 |
·一阶段的方法和两阶段的方法比较 | 第55-57页 |
结论 | 第57页 |
参考文献 | 第57-61页 |
攻读硕士学位期间发表论文及科研成果 | 第61-62页 |
致谢 | 第62-63页 |