基于统计学习的中文组块分析技术研究
摘要 | 第1-6页 |
Abstract | 第6-15页 |
第1章 绪论 | 第15-31页 |
·研究的目的和意义 | 第15-17页 |
·组块分析技术的研究现状 | 第17-28页 |
·英文组块分析研究综述 | 第18-21页 |
·中文组块分析研究综述 | 第21-24页 |
·中文组块分析相关领域研究 | 第24-28页 |
·本文的研究内容 | 第28-30页 |
·研究内容概述 | 第28-29页 |
·本文主要创新点 | 第29-30页 |
·本文的内容安排 | 第30-31页 |
第2章 组块定义和语料库构建方法 | 第31-48页 |
·引言 | 第31-32页 |
·组块定义和划分原则 | 第32-33页 |
·组块定义 | 第32页 |
·组块划分原则 | 第32-33页 |
·本文的组块分析语料库获取方法 | 第33-47页 |
·英文组块分析语料库的类型定义和获取方法 | 第33-36页 |
·自动抽取的中文组块分析语料库 | 第36-43页 |
·人工标注的中文组块分析语料库 | 第43-47页 |
·本章小结 | 第47-48页 |
第3章 基于统计学习模型的组块分析算法 | 第48-79页 |
·引言 | 第48-51页 |
·问题描述和性能评价 | 第51-54页 |
·组块分析的问题描述 | 第51页 |
·组块分析的性能评价 | 第51-53页 |
·组块分析的训练测试集 | 第53-54页 |
·基于产生式模型的分析算法 | 第54-57页 |
·隐马尔科夫模型 | 第54-55页 |
·组块分析的统计规则算法 | 第55-57页 |
·实验结果和分析 | 第57页 |
·基于判别式模型的分析算法 | 第57-66页 |
·组块分析的最大熵模型算法 | 第58-61页 |
·基于改进的最大熵马尔科夫模型的组块分析算法 | 第61-64页 |
·实验结果和分析 | 第64-66页 |
·基于条件随机域模型的分析算法 | 第66-73页 |
·标记偏置问题 | 第66-68页 |
·模型构建方法 | 第68-70页 |
·特征选择和算法流程 | 第70-71页 |
·实验结果和分析 | 第71-73页 |
·N-fold模板纠正后处理算法 | 第73-77页 |
·基于转换的错误驱动方法原理 | 第73-75页 |
·错误驱动的N-fold模板纠正算法 | 第75-76页 |
·实验结果和分析 | 第76-77页 |
·本章小结 | 第77-79页 |
第4章 组块分析算法的特征选取研究 | 第79-103页 |
·引言 | 第79-80页 |
·判别学习模型中的特征描述和抽取方法 | 第80-81页 |
·组块分析中的常用语言特征 | 第81-85页 |
·词对组块分析的影响分析 | 第81-83页 |
·词性对组块分析的影响分析 | 第83-84页 |
·词缀对组块分析的影响分析 | 第84页 |
·其他特征对组块分析的影响分析 | 第84-85页 |
·基于语义词典的语义类特征 | 第85-93页 |
·语义信息词典 | 第85-87页 |
·语义类特征抽取算法 | 第87-89页 |
·基于语义类特征的组块分析方法 | 第89-91页 |
·实验结果和分析 | 第91-93页 |
·语料库抽取的新词类特征 | 第93-102页 |
·基于条件信息熵的词类特征 | 第94-98页 |
·基于先验知识的词类特征 | 第98页 |
·实验结果和分析 | 第98-102页 |
·本章小结 | 第102-103页 |
第5章 中文组块分析一体化模型方法 | 第103-115页 |
·引言 | 第103-104页 |
·基于双层条件随机域的一体化模型 | 第104-106页 |
·基于条件随机域模型的中文词性标注 | 第104页 |
·双层条件随机域模型 | 第104-106页 |
·实验结果和分析 | 第106页 |
·基于新词类特征的一体化模型 | 第106-111页 |
·特征抽取 | 第107页 |
·模型结构 | 第107-109页 |
·名实体识别和仿词识别 | 第109页 |
·可信度估计 | 第109-110页 |
·实验结果和分析 | 第110-111页 |
·基于组块的相似度计算 | 第111-114页 |
·词语相似度计算 | 第112页 |
·基于词语相似度的组块相似度计算方法 | 第112-113页 |
·实验结果和分析 | 第113-114页 |
·本章小结 | 第114-115页 |
结论 | 第115-117页 |
参考文献 | 第117-125页 |
攻读学位期间发表的学术论文 | 第125-127页 |
致谢 | 第127-128页 |
个人简历 | 第128-129页 |