首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

半监督的命名实体识别

致谢第1-6页
摘要第6-7页
ABSTRACT第7-12页
1 引言第12-17页
   ·课题背景第12页
   ·研究历史第12-15页
     ·语言因素第13页
     ·文本类型或领域因素第13-14页
     ·实体类型因素第14-15页
     ·后续内容第15页
   ·相关应用第15-17页
2 命名实体识别相关技术第17-22页
   ·研究主体和难点第17-18页
     ·研究主体第17页
     ·命名实体识别特点和难点第17-18页
   ·国内外主要技术和方法第18-19页
     ·基于规则的方法第18页
     ·基于统计的方法第18页
     ·规则和统计结合的方法第18-19页
   ·解决命名实体识别问题的技术和算法第19-22页
     ·监督式的学习第19-20页
     ·半监督式的学习第20-21页
     ·无监督式的学习第21-22页
3 半监督的NER系统第22-33页
   ·训练子系统第23-29页
     ·预处理第23页
     ·通过种子检索网页第23-24页
     ·构造种子特征矩阵第24-28页
     ·根据特征矩阵选出有效特征第28-29页
     ·选出候选实体第29页
     ·噪音过滤器第29页
   ·标注子系统第29-30页
   ·系统问题分析第30-33页
     ·训练类中的噪音问题第31页
     ·正例负例的平衡问题第31-32页
     ·剩余类噪音问题第32-33页
4 噪音过滤技术第33-41页
   ·生成命名实体列表第33-34页
   ·基于词汇特征的噪音过滤第34-37页
     ·词汇特征相关噪音过滤第35-36页
     ·平衡正例数和候选实体个数第36页
     ·特征值的计算和阈值设定第36-37页
   ·信息冗余的噪音过滤第37-39页
   ·噪音过滤方法的结合第39页
   ·统计语义噪音过滤第39-40页
   ·结论第40-41页
5 ICTCLAS上的应用第41-44页
   ·ICTCLAS简介第41页
   ·ICTCLAS作原理第41-44页
     ·原子切分第41-42页
     ·初次切分第42页
     ·N最短路径第42-43页
     ·用户词典第43-44页
6 实验结果第44-53页
   ·影响噪音过滤性能的两个因素第44页
   ·实验数据分析第44-51页
     ·词汇特征噪音过滤实验结果第47-49页
     ·信息冗余噪音过滤实验结果第49-50页
     ·两种噪音过滤方法结合实验结果第50-51页
     ·在ICTCLAS上有应用结果第51页
   ·实验结果分析第51-53页
7 结论第53-55页
   ·本文工作总结第53-54页
   ·进一步工作第54-55页
参考文献第55-58页
作者简历第58-60页
学位论文数据集第60页

论文共60页,点击 下载论文
上一篇:宁夏弧形构造带中上地壳电性结构及其构造涵义
下一篇:消费者合同中格式条款的规制研究