面向信息抽取的中文跨文本指代消解研究

中文摘要	第1-5页
Abstract	第5-10页
第1章绪论	第10-17页
·研究背景与意义	第10-11页
·研究现状	第11-14页
·重名消歧	第12-14页
·跨文本实体指代消解	第14页
·本文的研究内容	第14-15页
·本文的组织结构	第15-17页
第2章相关知识介绍	第17-27页
·跨文本指代消解简介	第17-20页
·跨文本指代消解的基本概念	第17-18页
·跨文本指代消解的任务描述	第18-19页
·跨文本指代消解与信息检索和信息抽取	第19页
·跨文本指代消解与实体链接	第19-20页
·依存句法分析	第20-21页
·聚类算法	第21-24页
·K 中心聚类（K-medoid）	第21-22页
·层次聚类（Hierarchical）	第22-23页
·仿射传播聚类（Affinity Propagation，AP）	第23页
·谱聚类（Spectral Clustering）	第23-24页
·支撑向量机模型（SVM）	第24-25页
·性能评价标准	第25-26页
·本章小结	第26-27页
第3章中文跨文本指代语料库的建设	第27-43页
·语料库建设的相关工作	第27-28页
·语料的选取	第28-30页
·标注方法及过程	第30-33页
·语料库预处理	第30页
·初始指代链生成	第30-31页
·指代链手工调整	第31页
·指代链输出	第31-33页
·语料库统计与分析	第33-40页
·一致性检验	第33-34页
·语料库统计	第34-37页
·语料库的困惑度分析	第37-39页
·与 OntoNotes 语料库的比较	第39-40页
·基准性能	第40-42页
·本章小结	第42-43页
第4章基于无监督聚类的中文跨文本指代消解研究	第43-59页
·引言	第43页
·向量空间模型	第43-46页
·文本预处理	第44页
·特征选择	第44-45页
·相似度计算	第45-46页
·实体表述相似度	第46-51页
·最小编辑距离	第47-48页
·Jaro-Winkler 距离	第48页
·Monge-Elkan 距离	第48-49页
·改进相似度算法	第49-51页
·实验结果和分析	第51-58页
·特征算法选择	第51-54页
·特征融合系数	第54-56页
·不同的聚类算法对于性能的影响	第56页
·不同的实体类型的性能差异	第56-58页
·本章小结	第58-59页
第5章基于 SVM 分类的中文跨文本指代消解研究	第59-74页
·引言	第59页
·系统框架	第59-61页
·特征选择	第61-68页
·构词特征	第63-64页
·读音特征	第64页
·维基百科	第64-67页
·Google 搜索引擎	第67页
·同义词词林	第67-68页
·实验结果与分析	第68-73页
·实例对的过滤	第68-69页
·不同特征对于性能的影响	第69-70页
·与聚类方法的比较	第70-71页
·不同实体类型的性能差异	第71-73页
·本章小结	第73-74页
第6章总结与展望	第74-76页
·研究工作总结	第74-75页
·下一步工作展望	第75-76页
参考文献	第76-81页
攻读学位期间公开发表的论文	第81-82页
致谢	第82-83页