首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文信息抽取中的若干问题研究

内容提要第1-7页
第一章 绪论第7-14页
   ·信息抽取的含义第7-8页
   ·信息抽取和信息检索第8页
   ·中文信息抽取的特殊性第8-9页
   ·信息抽取的历史和现状第9-12页
   ·本文的主要研究内容和组织结构第12-14页
第二章 基于数学统计的语言模型第14-25页
   ·统计语言模型概述第14-15页
   ·隐马尔科夫模型第15-17页
   ·最大熵模型第17-21页
     ·最大熵简单实例介绍第18-19页
     ·最大熵模型框架概述第19-21页
   ·最大熵马尔科夫模型第21-22页
   ·条件随机域第22-23页
   ·四种模型对比第23-25页
第三章 中文自动分词第25-34页
   ·引言第25页
   ·中文自动分词的难点第25-26页
   ·词典查询算法和数据结构的改进第26-29页
     ·词典查询算法的现状第26-27页
     ·分词词典机制第27-29页
   ·中文自动分词算法的改进第29-33页
     ·基于碎片合并的未登录词的推测算法第29-31页
     ·N-最短路径词语粗分算法简介第31页
     ·基于零孤立点原则的消歧算法第31-33页
     ·中文自动分词步骤第33页
   ·实验结果及分析第33-34页
第四章 基于最大熵模型的中文命名实体识别第34-42页
   ·引言第34-35页
   ·中文命名实体识别的任务第35-36页
   ·基于最大熵模型的中文命名实体识别第36-40页
     ·特征选取第37-39页
     ·参数估计第39页
     ·解码算法第39-40页
   ·实验结果及分析第40-42页
第五章 基于CRF 的中文组块分析第42-48页
   ·引言第42页
   ·中文组块第42-43页
   ·基于CRF的中文组块分析第43-45页
   ·实验结果及分析第45-48页
第六章 总结第48-50页
参考文献第50-53页
攻读学位期间发表的学术论文第53-54页
摘要第54-57页
ABSTRACT第57-60页
致谢第60-61页
导师及作者简介第61页

论文共61页,点击 下载论文
上一篇:使用表单分类器识别特定领域的深度网入口
下一篇:无线电申报核查系统