中文自然语言理解中基于条件随机场理论的词法分析研究
摘要 | 第1-6页 |
ABSTRACT | 第6-18页 |
第一章 绪论 | 第18-38页 |
·中文词法分析简介 | 第18-28页 |
·汉语的特点 | 第18-19页 |
·中文词法分析的难点 | 第19-21页 |
·中文词法分析研究现状 | 第21-28页 |
·中文分词算法 | 第21-24页 |
·命名实体识别方法 | 第24-27页 |
·词性标注方法 | 第27-28页 |
·中文词法分析的应用 | 第28页 |
·条件随机场模型及其应用 | 第28-35页 |
·条件随机场模型的产生 | 第28-32页 |
·隐马尔可夫模型 | 第28-30页 |
·最大熵马尔可夫模型 | 第30-32页 |
·条件随机场模型 | 第32页 |
·条件随机场模型的主要研究方向和进展 | 第32-34页 |
·条件随机场在中文词法分析中的应用现状与前景 | 第34-35页 |
·本文的主要研究工作和贡献 | 第35-36页 |
·立论依据 | 第35页 |
·主要研究工作和创新点 | 第35-36页 |
·论文的结构安排 | 第36-38页 |
第二章 条件随机场 | 第38-54页 |
·图模型 | 第38-42页 |
·有向图模型 | 第39-40页 |
·无向图模型 | 第40-42页 |
·最大熵原理 | 第42-44页 |
·特征函数 | 第43-44页 |
·势函数 | 第44-46页 |
·区分性训练准则 | 第46-50页 |
·最大似然估计 | 第46-47页 |
·最大后验概率估计 | 第47-48页 |
·最小分类错误 | 第48-50页 |
·参数优化方法 | 第50-53页 |
·L-BFGS算法 | 第51-52页 |
·感知器算法 | 第52-53页 |
·本章小结 | 第53-54页 |
第三章 基于最小标注错误的条件随机场区分性训练 | 第54-82页 |
·基于最小音子错误训练准则 | 第54-62页 |
·最小音子错误目标函数定义 | 第54-56页 |
·最小音子错误区分性目标函数分析 | 第56-57页 |
·参数更新方法 | 第57-62页 |
·辅助函数 | 第57-59页 |
·扩展Baum Welch算法 | 第59页 |
·参数计算 | 第59-62页 |
·目标函数类比 | 第62-63页 |
·基于最小标注错误训练准则 | 第63-71页 |
·最小标注错误目标函数定义 | 第63-64页 |
·最小标注错误目标函数分析 | 第64-65页 |
·基于最小标注错误准则的参数更新方法 | 第65-70页 |
·最小标注错误目标函数导数 | 第65-66页 |
·参数计算方法 | 第66-70页 |
·基于最小标注错误准则的平滑和优化方法 | 第70-71页 |
·实验与结果 | 第71-80页 |
·中文分词 | 第71-79页 |
·实验数据与性能评价指标 | 第71-72页 |
·特征模板和标注集 | 第72-73页 |
·封闭集切分实验结果 | 第73-75页 |
·OOV词识别结果 | 第75-76页 |
·交叉测试性能比较 | 第76-77页 |
·与其它最佳切分系统的性能比较 | 第77-79页 |
·命名实体识别 | 第79-80页 |
·实验数据与评测指标 | 第79页 |
·特征模板和标注集 | 第79-80页 |
·实验结果 | 第80页 |
·本章小结 | 第80-82页 |
第四章 增强型条件随机场区分性训练方法 | 第82-106页 |
·支持向量机理论 | 第82-88页 |
·最大间隔分类超平面 | 第83-84页 |
·线性SVM | 第84-86页 |
·非线性SVM | 第86-87页 |
·多类分类问题 | 第87-88页 |
·大间隔模型 | 第88-91页 |
·最大间隔马尔可夫网络 | 第88-89页 |
·大间隔隐马尔可夫模型 | 第89-91页 |
·增强型条件随机场 | 第91-94页 |
·模型定义 | 第91-92页 |
·参数更新方法 | 第92-93页 |
·参数平滑方法 | 第93-94页 |
·实验与分析 | 第94-104页 |
·中文分词 | 第94-103页 |
·封闭集切分实验 | 第94-95页 |
·OOV词识别能力 | 第95-96页 |
·交叉测试 | 第96-97页 |
·增强因子对切分性能的影响 | 第97-103页 |
·训练代价比较 | 第103页 |
·命名实体识别 | 第103-104页 |
·几种方法识别性能比较 | 第103-104页 |
·增强因子对识别性能的影响 | 第104页 |
·本章小结 | 第104-106页 |
第五章 中文交集型歧义切分 | 第106-124页 |
·歧义字段定义 | 第107页 |
·基于词概率模型的歧义消解方法 | 第107-108页 |
·基于最大熵模型的歧义消解方法 | 第108-109页 |
·基于支持向量机的歧义消解方法 | 第109-118页 |
·特征统计量选择原则 | 第109-110页 |
·特征统计量表示方法 | 第110-112页 |
·实验与分析 | 第112-118页 |
·实验数据 | 第112页 |
·核函数及其参数选择 | 第112-115页 |
·特征表示方法对分类性能的影响 | 第115-116页 |
·训练样本的数目对分类性能的影响 | 第116-118页 |
·基于条件随机场的歧义消解方法 | 第118-122页 |
·观察序列和标注序列的表示 | 第118-119页 |
·特征模板 | 第119页 |
·实验与分析 | 第119-122页 |
·实验数据 | 第119-120页 |
·几种模型实验结果比较 | 第120-121页 |
·训练样本数目对标注正确率的影响 | 第121-122页 |
·本章小结 | 第122-124页 |
第六章 特定领域新词提取及词典优化方法 | 第124-134页 |
·词典优化系统总体框架 | 第125页 |
·中文自动分词算法 | 第125-127页 |
·新词提取模块 | 第127-130页 |
·候选词产生 | 第127-128页 |
·新词提取标准 | 第128-130页 |
·实验结果及分析 | 第130-132页 |
·实验流程 | 第130页 |
·性能评测指标 | 第130-131页 |
·实验结果 | 第131-132页 |
·本章小结 | 第132-134页 |
第七章 中文词法研究在汉语语音识别中的应用 | 第134-144页 |
·语音识别系统 | 第134-137页 |
·语音识别系统的框图 | 第134-135页 |
·语音识别系统的整体模型 | 第135-137页 |
·语言模型在语音识别中的应用 | 第137-139页 |
·语言模型的分类 | 第137页 |
·N元语法模型 | 第137-139页 |
·语言模型的评价标准 | 第139页 |
·中文词法研究在统计语言建模中的应用 | 第139-141页 |
·中文词法研究对语言建模的意义 | 第139-140页 |
·基于词的统计语言模型构建流程 | 第140-141页 |
·实验与分析 | 第141-143页 |
·数据库与实验配置 | 第141页 |
·实验结果 | 第141-143页 |
·切分性能比较 | 第141-142页 |
·语言模型对语音识别结果的影响 | 第142-143页 |
·本章小结 | 第143-144页 |
第八章 结论 | 第144-147页 |
·本文工作总结 | 第144-146页 |
·下一步工作的展望 | 第146-147页 |
参考文献 | 第147-159页 |
致谢 | 第159-160页 |
攻读博士学位期间的研究成果 | 第160-162页 |