首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向信息抽取的中文跨文本指代消解研究

中文摘要第1-5页
Abstract第5-10页
第1章 绪论第10-17页
   ·研究背景与意义第10-11页
   ·研究现状第11-14页
     ·重名消歧第12-14页
     ·跨文本实体指代消解第14页
   ·本文的研究内容第14-15页
   ·本文的组织结构第15-17页
第2章 相关知识介绍第17-27页
   ·跨文本指代消解简介第17-20页
     ·跨文本指代消解的基本概念第17-18页
     ·跨文本指代消解的任务描述第18-19页
     ·跨文本指代消解与信息检索和信息抽取第19页
     ·跨文本指代消解与实体链接第19-20页
   ·依存句法分析第20-21页
   ·聚类算法第21-24页
     ·K 中心聚类(K-medoid)第21-22页
     ·层次聚类(Hierarchical)第22-23页
     ·仿射传播聚类(Affinity Propagation,AP)第23页
     ·谱聚类(Spectral Clustering)第23-24页
   ·支撑向量机模型(SVM)第24-25页
   ·性能评价标准第25-26页
   ·本章小结第26-27页
第3章 中文跨文本指代语料库的建设第27-43页
   ·语料库建设的相关工作第27-28页
   ·语料的选取第28-30页
   ·标注方法及过程第30-33页
     ·语料库预处理第30页
     ·初始指代链生成第30-31页
     ·指代链手工调整第31页
     ·指代链输出第31-33页
   ·语料库统计与分析第33-40页
     ·一致性检验第33-34页
     ·语料库统计第34-37页
     ·语料库的困惑度分析第37-39页
     ·与 OntoNotes 语料库的比较第39-40页
   ·基准性能第40-42页
   ·本章小结第42-43页
第4章 基于无监督聚类的中文跨文本指代消解研究第43-59页
   ·引言第43页
   ·向量空间模型第43-46页
     ·文本预处理第44页
     ·特征选择第44-45页
     ·相似度计算第45-46页
   ·实体表述相似度第46-51页
     ·最小编辑距离第47-48页
     ·Jaro-Winkler 距离第48页
     ·Monge-Elkan 距离第48-49页
     ·改进相似度算法第49-51页
   ·实验结果和分析第51-58页
     ·特征算法选择第51-54页
     ·特征融合系数第54-56页
     ·不同的聚类算法对于性能的影响第56页
     ·不同的实体类型的性能差异第56-58页
   ·本章小结第58-59页
第5章 基于 SVM 分类的中文跨文本指代消解研究第59-74页
   ·引言第59页
   ·系统框架第59-61页
   ·特征选择第61-68页
     ·构词特征第63-64页
     ·读音特征第64页
     ·维基百科第64-67页
     ·Google 搜索引擎第67页
     ·同义词词林第67-68页
   ·实验结果与分析第68-73页
     ·实例对的过滤第68-69页
     ·不同特征对于性能的影响第69-70页
     ·与聚类方法的比较第70-71页
     ·不同实体类型的性能差异第71-73页
   ·本章小结第73-74页
第6章 总结与展望第74-76页
   ·研究工作总结第74-75页
   ·下一步工作展望第75-76页
参考文献第76-81页
攻读学位期间公开发表的论文第81-82页
致谢第82-83页

论文共83页,点击 下载论文
上一篇:数据仓库技术在医院系统集成中的应用
下一篇:基于网络服务质量的Linux频宽控制设计与实现