文本信息度量研究
摘要 | 第1-4页 |
Abstract | 第4-9页 |
第1章 引言 | 第9-22页 |
·研究背景 | 第9-11页 |
·信息度量研究现状 | 第11-19页 |
·短语非合成性度量 | 第11-15页 |
·概念相关性度量 | 第15-16页 |
·问题相似性度量 | 第16页 |
·句子关系的类比相似性度量 | 第16-19页 |
·本文的研究重点和工作内容 | 第19-22页 |
第2章 基于信息距离的短语非合成性度量 | 第22-49页 |
·研究背景 | 第22-23页 |
·理论基础 | 第23-29页 |
·多词表达的语言学特点 | 第23-26页 |
·Kolmogorov复杂性 | 第26-27页 |
·信息距离 | 第27-28页 |
·正规化信息距离 | 第28-29页 |
·多词表达距离 | 第29-33页 |
·动机 | 第29-30页 |
·定义 | 第30-31页 |
·近似计算方法 | 第31-33页 |
·条件型多词表达距离 | 第33-35页 |
·动机 | 第33页 |
·定义 | 第33-34页 |
·近似计算方法 | 第34-35页 |
·多词表达距离与其他度量的关系 | 第35-37页 |
·多词表达距离与点对互信息的关系 | 第35-36页 |
·多词表达距离与置换熵的关系 | 第36-37页 |
·多词表达距离的应用 | 第37-40页 |
·答案后处理 | 第37-39页 |
·命名实体抽取 | 第39-40页 |
·实验设置与结果 | 第40-47页 |
·短语非合成性排序 | 第40-43页 |
·候选答案排序 | 第43-45页 |
·复杂命名实体抽取 | 第45-47页 |
·本章小结 | 第47-49页 |
第3章 基于链接关系的概念相关性度量 | 第49-66页 |
·研究背景 | 第49-51页 |
·基于链接关系的概念相关性度量 | 第51-55页 |
·概念-类别图 | 第51页 |
·RCRank:基于概念链接和类别链接的排序算法 | 第51-55页 |
·基于RCRank的关系名称挖掘算法 | 第55页 |
·RCRank收敛性证明 | 第55-57页 |
·实验设置与结果 | 第57-62页 |
·数据准备 | 第57-58页 |
·实验:相关概念推荐 | 第58-60页 |
·实验:关系类型识别 | 第60-62页 |
·示例分析 | 第62页 |
·本章小结 | 第62-66页 |
第4章 基于模板集的问题相似性度量 | 第66-80页 |
·研究背景 | 第66-67页 |
·基于模板集的句子相似度度量 | 第67-71页 |
·自然语言问题的特点分析 | 第67-68页 |
·硬模板的构建 | 第68-70页 |
·软模板的构建 | 第70-71页 |
·基于模板集的相似性度量 | 第71页 |
·在问题分类中的应用 | 第71-76页 |
·面向用户意图的问题分类体系 | 第71-74页 |
·分类器的选择 | 第74-76页 |
·实验设置与结果 | 第76-78页 |
·数据准备 | 第76页 |
·比较方法介绍 | 第76-77页 |
·实验结果 | 第77-78页 |
·软模板的例子 | 第78页 |
·本章小结 | 第78-80页 |
第5章 基于核函数的类比相似性度量 | 第80-99页 |
·背景介绍 | 第80-82页 |
·基于核函数的句子重写分类框架 | 第82-83页 |
·字符串重写核 | 第83-85页 |
·k元双射字符串重写核 | 第85-92页 |
·定义 | 第85-86页 |
·快速算法 | 第86-92页 |
·时间复杂度分析 | 第92-94页 |
·实验设置与结果 | 第94-98页 |
·同义句识别 | 第95-96页 |
·文本蕴含关系识别 | 第96-98页 |
·本章小结 | 第98-99页 |
第6章 总结与展望 | 第99-101页 |
参考文献 | 第101-107页 |
致谢 | 第107-109页 |
个人简历、在学期间发表的学术论文与研究成果 | 第109-110页 |