首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于聚类的英汉人名消歧研究

摘要第1-5页
Abstract第5-10页
第1章 引言第10-13页
   ·研究背景与意义第10-11页
   ·研究难点第11-12页
   ·本文的组织第12-13页
第2章 相关技术和背景第13-33页
   ·人名消歧与相关方法的比较第13页
   ·人名消歧常用方法第13-16页
     ·向量空间模型聚类方法第14页
     ·社会网络模型聚类方法第14-15页
     ·文本分类方法第15-16页
     ·模型生成方法第16页
   ·英文人名消歧评测简介第16-27页
     ·第一届英文人名消歧评测(WePS-1)第17-22页
     ·第二届英文人名消歧评测(WePS-2)第22-27页
   ·中文人名消歧评测(CIPS-SIGHAN 2010 BAKEOFF-3)介绍第27-32页
   ·本章小节第32-33页
第3章 基于层次聚类的英文人名消歧方法及实现第33-47页
   ·核心思想及主体框架第33页
   ·语料中的数据预处理第33-34页
     ·数据加权合并、去停用词、词根还原即格式化输出第33-34页
     ·存储规范设计第34页
     ·缺失rank 的处理第34页
   ·特征的选取第34-37页
     ·URL、Email 的提取及优化第34-35页
     ·提取正文内容第35页
     ·命名实体的提取第35页
     ·微型格式(Microformats)的提取第35-36页
     ·干扰文档分析第36-37页
   ·聚类方法的选择第37-39页
     ·K-Means 算法第37-38页
     ·自底向上的层次聚类算法第38-39页
   ·实验设计第39-40页
     ·实验评测语料第39页
     ·实验结果评价方法第39页
     ·实验环境配置第39-40页
   ·主要实验结果分析第40-46页
     ·命名实体消歧效果及分析第40-41页
     ·正文内容消歧效果及分析第41-42页
     ·URL 消歧效果及分析第42-43页
     ·特征融合消歧效果及分析第43页
     ·特征融合后的聚类数目设定第43-46页
   ·本章小节第46-47页
第4章 基于两步聚类的中文人名消歧方法与实现第47-60页
   ·前言第47页
   ·特征抽取第47-49页
     ·跳跃树(jumping-tree)第47-48页
     ·基于跳跃距离(Jumping-Distance,JD)的N-Gram第48-49页
   ·消歧系统的实现第49-50页
     ·系统一第49-50页
     ·系统二第50页
   ·两步聚类算法第50-56页
     ·AP 聚类算法第50-56页
     ·两步AP 聚类第56页
   ·实验设计与结果分析第56-59页
     ·实验评测语料第56-57页
     ·实验结果评测方案第57页
     ·处理干扰(discarded)文档第57页
     ·两步聚类评测第57-59页
   ·本章小结第59-60页
第5章 总结与展望第60-62页
   ·本文总结第60-61页
   ·展望第61-62页
参考文献第62-67页
攻读学位期间公开发表的论文第67-68页
致谢第68-69页

论文共69页,点击 下载论文
上一篇:基于专用物联网的远程更新技术研究与应用
下一篇:基于稀疏表示的人脸识别算法研究