中文自然语言理解中基于条件随机场理论的词法分析研究
| 摘要 | 第1-6页 |
| ABSTRACT | 第6-18页 |
| 第一章 绪论 | 第18-38页 |
| ·中文词法分析简介 | 第18-28页 |
| ·汉语的特点 | 第18-19页 |
| ·中文词法分析的难点 | 第19-21页 |
| ·中文词法分析研究现状 | 第21-28页 |
| ·中文分词算法 | 第21-24页 |
| ·命名实体识别方法 | 第24-27页 |
| ·词性标注方法 | 第27-28页 |
| ·中文词法分析的应用 | 第28页 |
| ·条件随机场模型及其应用 | 第28-35页 |
| ·条件随机场模型的产生 | 第28-32页 |
| ·隐马尔可夫模型 | 第28-30页 |
| ·最大熵马尔可夫模型 | 第30-32页 |
| ·条件随机场模型 | 第32页 |
| ·条件随机场模型的主要研究方向和进展 | 第32-34页 |
| ·条件随机场在中文词法分析中的应用现状与前景 | 第34-35页 |
| ·本文的主要研究工作和贡献 | 第35-36页 |
| ·立论依据 | 第35页 |
| ·主要研究工作和创新点 | 第35-36页 |
| ·论文的结构安排 | 第36-38页 |
| 第二章 条件随机场 | 第38-54页 |
| ·图模型 | 第38-42页 |
| ·有向图模型 | 第39-40页 |
| ·无向图模型 | 第40-42页 |
| ·最大熵原理 | 第42-44页 |
| ·特征函数 | 第43-44页 |
| ·势函数 | 第44-46页 |
| ·区分性训练准则 | 第46-50页 |
| ·最大似然估计 | 第46-47页 |
| ·最大后验概率估计 | 第47-48页 |
| ·最小分类错误 | 第48-50页 |
| ·参数优化方法 | 第50-53页 |
| ·L-BFGS算法 | 第51-52页 |
| ·感知器算法 | 第52-53页 |
| ·本章小结 | 第53-54页 |
| 第三章 基于最小标注错误的条件随机场区分性训练 | 第54-82页 |
| ·基于最小音子错误训练准则 | 第54-62页 |
| ·最小音子错误目标函数定义 | 第54-56页 |
| ·最小音子错误区分性目标函数分析 | 第56-57页 |
| ·参数更新方法 | 第57-62页 |
| ·辅助函数 | 第57-59页 |
| ·扩展Baum Welch算法 | 第59页 |
| ·参数计算 | 第59-62页 |
| ·目标函数类比 | 第62-63页 |
| ·基于最小标注错误训练准则 | 第63-71页 |
| ·最小标注错误目标函数定义 | 第63-64页 |
| ·最小标注错误目标函数分析 | 第64-65页 |
| ·基于最小标注错误准则的参数更新方法 | 第65-70页 |
| ·最小标注错误目标函数导数 | 第65-66页 |
| ·参数计算方法 | 第66-70页 |
| ·基于最小标注错误准则的平滑和优化方法 | 第70-71页 |
| ·实验与结果 | 第71-80页 |
| ·中文分词 | 第71-79页 |
| ·实验数据与性能评价指标 | 第71-72页 |
| ·特征模板和标注集 | 第72-73页 |
| ·封闭集切分实验结果 | 第73-75页 |
| ·OOV词识别结果 | 第75-76页 |
| ·交叉测试性能比较 | 第76-77页 |
| ·与其它最佳切分系统的性能比较 | 第77-79页 |
| ·命名实体识别 | 第79-80页 |
| ·实验数据与评测指标 | 第79页 |
| ·特征模板和标注集 | 第79-80页 |
| ·实验结果 | 第80页 |
| ·本章小结 | 第80-82页 |
| 第四章 增强型条件随机场区分性训练方法 | 第82-106页 |
| ·支持向量机理论 | 第82-88页 |
| ·最大间隔分类超平面 | 第83-84页 |
| ·线性SVM | 第84-86页 |
| ·非线性SVM | 第86-87页 |
| ·多类分类问题 | 第87-88页 |
| ·大间隔模型 | 第88-91页 |
| ·最大间隔马尔可夫网络 | 第88-89页 |
| ·大间隔隐马尔可夫模型 | 第89-91页 |
| ·增强型条件随机场 | 第91-94页 |
| ·模型定义 | 第91-92页 |
| ·参数更新方法 | 第92-93页 |
| ·参数平滑方法 | 第93-94页 |
| ·实验与分析 | 第94-104页 |
| ·中文分词 | 第94-103页 |
| ·封闭集切分实验 | 第94-95页 |
| ·OOV词识别能力 | 第95-96页 |
| ·交叉测试 | 第96-97页 |
| ·增强因子对切分性能的影响 | 第97-103页 |
| ·训练代价比较 | 第103页 |
| ·命名实体识别 | 第103-104页 |
| ·几种方法识别性能比较 | 第103-104页 |
| ·增强因子对识别性能的影响 | 第104页 |
| ·本章小结 | 第104-106页 |
| 第五章 中文交集型歧义切分 | 第106-124页 |
| ·歧义字段定义 | 第107页 |
| ·基于词概率模型的歧义消解方法 | 第107-108页 |
| ·基于最大熵模型的歧义消解方法 | 第108-109页 |
| ·基于支持向量机的歧义消解方法 | 第109-118页 |
| ·特征统计量选择原则 | 第109-110页 |
| ·特征统计量表示方法 | 第110-112页 |
| ·实验与分析 | 第112-118页 |
| ·实验数据 | 第112页 |
| ·核函数及其参数选择 | 第112-115页 |
| ·特征表示方法对分类性能的影响 | 第115-116页 |
| ·训练样本的数目对分类性能的影响 | 第116-118页 |
| ·基于条件随机场的歧义消解方法 | 第118-122页 |
| ·观察序列和标注序列的表示 | 第118-119页 |
| ·特征模板 | 第119页 |
| ·实验与分析 | 第119-122页 |
| ·实验数据 | 第119-120页 |
| ·几种模型实验结果比较 | 第120-121页 |
| ·训练样本数目对标注正确率的影响 | 第121-122页 |
| ·本章小结 | 第122-124页 |
| 第六章 特定领域新词提取及词典优化方法 | 第124-134页 |
| ·词典优化系统总体框架 | 第125页 |
| ·中文自动分词算法 | 第125-127页 |
| ·新词提取模块 | 第127-130页 |
| ·候选词产生 | 第127-128页 |
| ·新词提取标准 | 第128-130页 |
| ·实验结果及分析 | 第130-132页 |
| ·实验流程 | 第130页 |
| ·性能评测指标 | 第130-131页 |
| ·实验结果 | 第131-132页 |
| ·本章小结 | 第132-134页 |
| 第七章 中文词法研究在汉语语音识别中的应用 | 第134-144页 |
| ·语音识别系统 | 第134-137页 |
| ·语音识别系统的框图 | 第134-135页 |
| ·语音识别系统的整体模型 | 第135-137页 |
| ·语言模型在语音识别中的应用 | 第137-139页 |
| ·语言模型的分类 | 第137页 |
| ·N元语法模型 | 第137-139页 |
| ·语言模型的评价标准 | 第139页 |
| ·中文词法研究在统计语言建模中的应用 | 第139-141页 |
| ·中文词法研究对语言建模的意义 | 第139-140页 |
| ·基于词的统计语言模型构建流程 | 第140-141页 |
| ·实验与分析 | 第141-143页 |
| ·数据库与实验配置 | 第141页 |
| ·实验结果 | 第141-143页 |
| ·切分性能比较 | 第141-142页 |
| ·语言模型对语音识别结果的影响 | 第142-143页 |
| ·本章小结 | 第143-144页 |
| 第八章 结论 | 第144-147页 |
| ·本文工作总结 | 第144-146页 |
| ·下一步工作的展望 | 第146-147页 |
| 参考文献 | 第147-159页 |
| 致谢 | 第159-160页 |
| 攻读博士学位期间的研究成果 | 第160-162页 |