文本信息度量研究
| 摘要 | 第1-4页 |
| Abstract | 第4-9页 |
| 第1章 引言 | 第9-22页 |
| ·研究背景 | 第9-11页 |
| ·信息度量研究现状 | 第11-19页 |
| ·短语非合成性度量 | 第11-15页 |
| ·概念相关性度量 | 第15-16页 |
| ·问题相似性度量 | 第16页 |
| ·句子关系的类比相似性度量 | 第16-19页 |
| ·本文的研究重点和工作内容 | 第19-22页 |
| 第2章 基于信息距离的短语非合成性度量 | 第22-49页 |
| ·研究背景 | 第22-23页 |
| ·理论基础 | 第23-29页 |
| ·多词表达的语言学特点 | 第23-26页 |
| ·Kolmogorov复杂性 | 第26-27页 |
| ·信息距离 | 第27-28页 |
| ·正规化信息距离 | 第28-29页 |
| ·多词表达距离 | 第29-33页 |
| ·动机 | 第29-30页 |
| ·定义 | 第30-31页 |
| ·近似计算方法 | 第31-33页 |
| ·条件型多词表达距离 | 第33-35页 |
| ·动机 | 第33页 |
| ·定义 | 第33-34页 |
| ·近似计算方法 | 第34-35页 |
| ·多词表达距离与其他度量的关系 | 第35-37页 |
| ·多词表达距离与点对互信息的关系 | 第35-36页 |
| ·多词表达距离与置换熵的关系 | 第36-37页 |
| ·多词表达距离的应用 | 第37-40页 |
| ·答案后处理 | 第37-39页 |
| ·命名实体抽取 | 第39-40页 |
| ·实验设置与结果 | 第40-47页 |
| ·短语非合成性排序 | 第40-43页 |
| ·候选答案排序 | 第43-45页 |
| ·复杂命名实体抽取 | 第45-47页 |
| ·本章小结 | 第47-49页 |
| 第3章 基于链接关系的概念相关性度量 | 第49-66页 |
| ·研究背景 | 第49-51页 |
| ·基于链接关系的概念相关性度量 | 第51-55页 |
| ·概念-类别图 | 第51页 |
| ·RCRank:基于概念链接和类别链接的排序算法 | 第51-55页 |
| ·基于RCRank的关系名称挖掘算法 | 第55页 |
| ·RCRank收敛性证明 | 第55-57页 |
| ·实验设置与结果 | 第57-62页 |
| ·数据准备 | 第57-58页 |
| ·实验:相关概念推荐 | 第58-60页 |
| ·实验:关系类型识别 | 第60-62页 |
| ·示例分析 | 第62页 |
| ·本章小结 | 第62-66页 |
| 第4章 基于模板集的问题相似性度量 | 第66-80页 |
| ·研究背景 | 第66-67页 |
| ·基于模板集的句子相似度度量 | 第67-71页 |
| ·自然语言问题的特点分析 | 第67-68页 |
| ·硬模板的构建 | 第68-70页 |
| ·软模板的构建 | 第70-71页 |
| ·基于模板集的相似性度量 | 第71页 |
| ·在问题分类中的应用 | 第71-76页 |
| ·面向用户意图的问题分类体系 | 第71-74页 |
| ·分类器的选择 | 第74-76页 |
| ·实验设置与结果 | 第76-78页 |
| ·数据准备 | 第76页 |
| ·比较方法介绍 | 第76-77页 |
| ·实验结果 | 第77-78页 |
| ·软模板的例子 | 第78页 |
| ·本章小结 | 第78-80页 |
| 第5章 基于核函数的类比相似性度量 | 第80-99页 |
| ·背景介绍 | 第80-82页 |
| ·基于核函数的句子重写分类框架 | 第82-83页 |
| ·字符串重写核 | 第83-85页 |
| ·k元双射字符串重写核 | 第85-92页 |
| ·定义 | 第85-86页 |
| ·快速算法 | 第86-92页 |
| ·时间复杂度分析 | 第92-94页 |
| ·实验设置与结果 | 第94-98页 |
| ·同义句识别 | 第95-96页 |
| ·文本蕴含关系识别 | 第96-98页 |
| ·本章小结 | 第98-99页 |
| 第6章 总结与展望 | 第99-101页 |
| 参考文献 | 第101-107页 |
| 致谢 | 第107-109页 |
| 个人简历、在学期间发表的学术论文与研究成果 | 第109-110页 |