首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

自然语言处理中词相关性知识无导获取和均衡分类器构建

独创性声明第1页
关于论文使用授权的说明第2-3页
摘要第3-5页
Abstract第5-7页
目录第7-10页
图片索引第10-11页
表格索引第11-12页
第1章、动机、定位与目标第12-22页
     ·研究内容第12页
     ·启发与动机第12-14页
     ·知识、发现与获取第14-16页
     ·知识的分类第14-15页
       ·知识、知识发现与知识获取第15-16页
     ·实用主义与我们的目标第16-17页
     ·实用的价值第17-19页
     ·本文的提纲第19-22页
第1部、词相关性知识的无导获取第22-98页
 第2章、词相关性知识无导获取的框架第24-44页
     ·背景介绍第24-30页
       ·手工词语知识库第24-26页
       ·词语知识的自动获取第26-30页
     ·我们的目标和方法第30-43页
       ·我们的目标第30-31页
       ·方法的渊源第31-34页
         ·向量空间模型第31-34页
         ·词空间第34页
       ·我们的方法第34-43页
         ·模型的选择第34-35页
         ·我们方法的特点第35-36页
         ·我们的方法第36-41页
         ·词相关性知识获取的框架第41-43页
     ·本章小结第43-44页
 第3章、上下文有效范围的定量描述第44-56页
     ·背景介绍第44-46页
       ·问题的提出和意义第44-45页
       ·已有研究第45页
       ·我们的策略第45-46页
     ·词语上下文有效范围的定量描述第46-53页
       ·词语上下文位置信息量的确定第46-49页
         ·词语上下文矩阵的符号信息系统第46-47页
         ·信息增益及其在上下文位置信息量确定中的应用第47-48页
         ·上下文位置信息量的计算结果及其分析第48-49页
       ·上下文有效范围的量化确定第49-53页
         ·上下文位置信息量函数第49-52页
         ·上下文有效范围的确定第52-53页
     ·方法的局限性第53-54页
     ·分析与讨论第54-56页
 第4章、信息、降维与噪音第56-82页
     ·信息与“噪音”第56-59页
       ·标准与手段第56-57页
       ·定义“噪音”第57-59页
     ·单属性降维和噪音消除第59-61页
       ·上下文词语的权重计算第59-60页
       ·降维与消除噪音第60-61页
     ·线性降维与消除噪音第61-65页
       ·主成分分析技术第62-63页
       ·PCA技术与消除噪音第63-65页
     ·多义词的词义消歧第65-81页
       ·背景介绍第66-69页
         ·已有的词义消歧无导方法第67-68页
         ·已有的词义消歧有导方法第68-69页
       ·我们的方法第69-81页
         ·基于义项向量的词义消歧有导方法第70-74页
       ·基于义项词语的词义消歧“半自动”方法第74-81页
       ·结论第81页
     ·本章小结第81-82页
 第5章、二维可视化、词距离及验证实验第82-98页
     ·二维可视化验证与“累计方差贡献率”的确定第82-90页
       ·维可视化与自组织特征映射(Self-Organizing Maps)第82-85页
       ·二维显示验证第85-89页
       ·%“累计方差贡献率”的假设与推广第89-90页
       ·提问与解释第90页
     ·距离方法的选择第90-92页
       ·距离计算函数第90-91页
       ·相似度计算函数第91页
       ·距离测度的选择第91-92页
     ·词相关性知识的验证实验第92-95页
       ·知识获取步骤和相关数据第92-93页
       ·应用词相关性知识的必要条件第93页
       ·Memory-Based Learning第93-94页
       ·验证实验及其结果第94-95页
     ·得与失第95-98页
第2部、面向自然语言处理的均衡分类器第98-134页
 第6章、RMBL分类器的构建第102-116页
     ·有导符号机器学习第102-106页
       ·覆盖法第103-104页
       ·分治法第104页
       ·Lazy Learning第104-105页
       ·Inductive Logic Programming第105-106页
     ·面向自然语言处理RMBL分类器的构建第106-116页
       ·“鸡肋”的尴尬第106页
       ·问题的关键第106-108页
       ·我们的目标第108页
       ·粗集与自然语言处理第108-111页
       ·Memory-Based Learning与自然语言处理第111-112页
       ·我们的RMBL分类器第112-116页
 第7章、RMBL分类器实验验证及其他第116-130页
     ·验证实验第116-126页
       ·实验Ⅰ:汉语多义词词义消歧第116-121页
         ·知识获取阶段的实验过程及数据第116-118页
         ·分类推理阶段的实验过程及数据第118-121页
       ·实验Ⅱ:英语介词短语消歧(Prepositional Phrase Attachment)第121-125页
         ·训练集与测试集第122-123页
         ·知识获取阶段的实验过程及数据第123页
         ·分类推理阶段的实验过程及数据第123-125页
       ·实验结论第125-126页
     ·相关工作第126-128页
     ·讨论与结论第128-130页
       ·方法的局限性第128-129页
       ·比较与分析第129页
       ·总结论第129-130页
 第8章、切身的体会第130-134页
附录第134-148页
 [附录1] 对应分析的特征值和特征向量求解算法第134-136页
 [附录2] PCA的MATLAB代码第136-138页
 [附录3] 对应分析的MATLAB代码第138-140页
 [附录4] RMBL在汉语多义词词义消歧中提取的规则第140-146页
 [附录5] RMBL在英文介词短语归并问题(PP)提取的规则第146-148页
参考文献第148-156页
作者简介第156-158页
攻读博士学位期间发表论文第158-160页
致谢第160-162页

论文共162页,点击 下载论文
上一篇:分布式虚拟场景实时绘制技术的研究与实现
下一篇:人工生物肝生物反应器搅拌系统的研制