中文信息抽取中的若干问题研究

内容提要	第1-7页
第一章绪论	第7-14页
·信息抽取的含义	第7-8页
·信息抽取和信息检索	第8页
·中文信息抽取的特殊性	第8-9页
·信息抽取的历史和现状	第9-12页
·本文的主要研究内容和组织结构	第12-14页
第二章基于数学统计的语言模型	第14-25页
·统计语言模型概述	第14-15页
·隐马尔科夫模型	第15-17页
·最大熵模型	第17-21页
·最大熵简单实例介绍	第18-19页
·最大熵模型框架概述	第19-21页
·最大熵马尔科夫模型	第21-22页
·条件随机域	第22-23页
·四种模型对比	第23-25页
第三章中文自动分词	第25-34页
·引言	第25页
·中文自动分词的难点	第25-26页
·词典查询算法和数据结构的改进	第26-29页
·词典查询算法的现状	第26-27页
·分词词典机制	第27-29页
·中文自动分词算法的改进	第29-33页
·基于碎片合并的未登录词的推测算法	第29-31页
·N-最短路径词语粗分算法简介	第31页
·基于零孤立点原则的消歧算法	第31-33页
·中文自动分词步骤	第33页
·实验结果及分析	第33-34页
第四章基于最大熵模型的中文命名实体识别	第34-42页
·引言	第34-35页
·中文命名实体识别的任务	第35-36页
·基于最大熵模型的中文命名实体识别	第36-40页
·特征选取	第37-39页
·参数估计	第39页
·解码算法	第39-40页
·实验结果及分析	第40-42页
第五章基于CRF 的中文组块分析	第42-48页
·引言	第42页
·中文组块	第42-43页
·基于CRF的中文组块分析	第43-45页
·实验结果及分析	第45-48页
第六章总结	第48-50页
参考文献	第50-53页
攻读学位期间发表的学术论文	第53-54页
摘要	第54-57页
ABSTRACT	第57-60页
致谢	第60-61页
导师及作者简介	第61页