| 独创性声明 | 第1页 |
| 关于论文使用授权的说明 | 第2-3页 |
| 摘要 | 第3-5页 |
| Abstract | 第5-7页 |
| 目录 | 第7-10页 |
| 图片索引 | 第10-11页 |
| 表格索引 | 第11-12页 |
| 第1章、动机、定位与目标 | 第12-22页 |
| ·研究内容 | 第12页 |
| ·启发与动机 | 第12-14页 |
| ·知识、发现与获取 | 第14-16页 |
| ·知识的分类 | 第14-15页 |
| ·知识、知识发现与知识获取 | 第15-16页 |
| ·实用主义与我们的目标 | 第16-17页 |
| ·实用的价值 | 第17-19页 |
| ·本文的提纲 | 第19-22页 |
| 第1部、词相关性知识的无导获取 | 第22-98页 |
| 第2章、词相关性知识无导获取的框架 | 第24-44页 |
| ·背景介绍 | 第24-30页 |
| ·手工词语知识库 | 第24-26页 |
| ·词语知识的自动获取 | 第26-30页 |
| ·我们的目标和方法 | 第30-43页 |
| ·我们的目标 | 第30-31页 |
| ·方法的渊源 | 第31-34页 |
| ·向量空间模型 | 第31-34页 |
| ·词空间 | 第34页 |
| ·我们的方法 | 第34-43页 |
| ·模型的选择 | 第34-35页 |
| ·我们方法的特点 | 第35-36页 |
| ·我们的方法 | 第36-41页 |
| ·词相关性知识获取的框架 | 第41-43页 |
| ·本章小结 | 第43-44页 |
| 第3章、上下文有效范围的定量描述 | 第44-56页 |
| ·背景介绍 | 第44-46页 |
| ·问题的提出和意义 | 第44-45页 |
| ·已有研究 | 第45页 |
| ·我们的策略 | 第45-46页 |
| ·词语上下文有效范围的定量描述 | 第46-53页 |
| ·词语上下文位置信息量的确定 | 第46-49页 |
| ·词语上下文矩阵的符号信息系统 | 第46-47页 |
| ·信息增益及其在上下文位置信息量确定中的应用 | 第47-48页 |
| ·上下文位置信息量的计算结果及其分析 | 第48-49页 |
| ·上下文有效范围的量化确定 | 第49-53页 |
| ·上下文位置信息量函数 | 第49-52页 |
| ·上下文有效范围的确定 | 第52-53页 |
| ·方法的局限性 | 第53-54页 |
| ·分析与讨论 | 第54-56页 |
| 第4章、信息、降维与噪音 | 第56-82页 |
| ·信息与“噪音” | 第56-59页 |
| ·标准与手段 | 第56-57页 |
| ·定义“噪音” | 第57-59页 |
| ·单属性降维和噪音消除 | 第59-61页 |
| ·上下文词语的权重计算 | 第59-60页 |
| ·降维与消除噪音 | 第60-61页 |
| ·线性降维与消除噪音 | 第61-65页 |
| ·主成分分析技术 | 第62-63页 |
| ·PCA技术与消除噪音 | 第63-65页 |
| ·多义词的词义消歧 | 第65-81页 |
| ·背景介绍 | 第66-69页 |
| ·已有的词义消歧无导方法 | 第67-68页 |
| ·已有的词义消歧有导方法 | 第68-69页 |
| ·我们的方法 | 第69-81页 |
| ·基于义项向量的词义消歧有导方法 | 第70-74页 |
| ·基于义项词语的词义消歧“半自动”方法 | 第74-81页 |
| ·结论 | 第81页 |
| ·本章小结 | 第81-82页 |
| 第5章、二维可视化、词距离及验证实验 | 第82-98页 |
| ·二维可视化验证与“累计方差贡献率”的确定 | 第82-90页 |
| ·维可视化与自组织特征映射(Self-Organizing Maps) | 第82-85页 |
| ·二维显示验证 | 第85-89页 |
| ·%“累计方差贡献率”的假设与推广 | 第89-90页 |
| ·提问与解释 | 第90页 |
| ·距离方法的选择 | 第90-92页 |
| ·距离计算函数 | 第90-91页 |
| ·相似度计算函数 | 第91页 |
| ·距离测度的选择 | 第91-92页 |
| ·词相关性知识的验证实验 | 第92-95页 |
| ·知识获取步骤和相关数据 | 第92-93页 |
| ·应用词相关性知识的必要条件 | 第93页 |
| ·Memory-Based Learning | 第93-94页 |
| ·验证实验及其结果 | 第94-95页 |
| ·得与失 | 第95-98页 |
| 第2部、面向自然语言处理的均衡分类器 | 第98-134页 |
| 第6章、RMBL分类器的构建 | 第102-116页 |
| ·有导符号机器学习 | 第102-106页 |
| ·覆盖法 | 第103-104页 |
| ·分治法 | 第104页 |
| ·Lazy Learning | 第104-105页 |
| ·Inductive Logic Programming | 第105-106页 |
| ·面向自然语言处理RMBL分类器的构建 | 第106-116页 |
| ·“鸡肋”的尴尬 | 第106页 |
| ·问题的关键 | 第106-108页 |
| ·我们的目标 | 第108页 |
| ·粗集与自然语言处理 | 第108-111页 |
| ·Memory-Based Learning与自然语言处理 | 第111-112页 |
| ·我们的RMBL分类器 | 第112-116页 |
| 第7章、RMBL分类器实验验证及其他 | 第116-130页 |
| ·验证实验 | 第116-126页 |
| ·实验Ⅰ:汉语多义词词义消歧 | 第116-121页 |
| ·知识获取阶段的实验过程及数据 | 第116-118页 |
| ·分类推理阶段的实验过程及数据 | 第118-121页 |
| ·实验Ⅱ:英语介词短语消歧(Prepositional Phrase Attachment) | 第121-125页 |
| ·训练集与测试集 | 第122-123页 |
| ·知识获取阶段的实验过程及数据 | 第123页 |
| ·分类推理阶段的实验过程及数据 | 第123-125页 |
| ·实验结论 | 第125-126页 |
| ·相关工作 | 第126-128页 |
| ·讨论与结论 | 第128-130页 |
| ·方法的局限性 | 第128-129页 |
| ·比较与分析 | 第129页 |
| ·总结论 | 第129-130页 |
| 第8章、切身的体会 | 第130-134页 |
| 附录 | 第134-148页 |
| [附录1] 对应分析的特征值和特征向量求解算法 | 第134-136页 |
| [附录2] PCA的MATLAB代码 | 第136-138页 |
| [附录3] 对应分析的MATLAB代码 | 第138-140页 |
| [附录4] RMBL在汉语多义词词义消歧中提取的规则 | 第140-146页 |
| [附录5] RMBL在英文介词短语归并问题(PP)提取的规则 | 第146-148页 |
| 参考文献 | 第148-156页 |
| 作者简介 | 第156-158页 |
| 攻读博士学位期间发表论文 | 第158-160页 |
| 致谢 | 第160-162页 |