首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向网络人物搜索的中文人名消歧

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-17页
   ·课题目的及意义第10-12页
   ·国内外研究现状第12-16页
   ·本文主要研究内容第16-17页
第2章 人物搜索核心技术分析第17-22页
   ·垂直搜索技术概述第17页
   ·网页正文抽取概述第17-18页
   ·网页去重概述第18页
   ·人名消歧相关概述第18-21页
     ·文本表示模型第18-19页
     ·相似度衡量方法第19-20页
     ·特征选择方法第20-21页
     ·常用文本聚类算法第21页
   ·本章小结第21-22页
第3章 人物搜索数据预处理第22-30页
   ·数据预处理框架第22-23页
   ·基于BK 树检索的网页去重算法第23-24页
   ·基于分布函数的网页正文抽取算法第24-26页
   ·基于多重预处理与CRF 相结合的中文分词算法第26-29页
     ·预处理器第27-28页
     ·分词器第28页
     ·后处理第28-29页
   ·人物属性抽取第29页
   ·本章小结第29-30页
第4章 基于三层特征空间与两阶段聚类算法的中文人名消歧第30-51页
   ·中文人名消歧算法框架第30-31页
   ·三层特征空间构造第31-47页
     ·基本特征空间第32页
     ·属性特征空间第32-36页
     ·语义特征空间第36-47页
   ·两阶段聚类算法第47-50页
     ·基于互斥人物基本属性特征的K-means 文本聚类第47-48页
     ·基于EM 算法的二阶段文本聚类第48-49页
     ·两阶段聚类算法优势第49-50页
   ·本章小结第50-51页
第5章 人物搜索系统第51-56页
   ·系统框架第51-52页
   ·各模块功能介绍第52-55页
     ·网页数据采集模块第52-53页
     ·数据预处理模块第53页
     ·人名消歧模块第53-54页
     ·检索模块第54-55页
   ·本章小结第55-56页
第6章 实验评测与结果分析第56-71页
   ·实验环境第56页
   ·实验数据第56-58页
   ·算法评价方法第58-59页
     ·中文分词评价方法第58页
     ·文本分类评价方法第58-59页
     ·人名消歧评价方法第59页
   ·实验结果分析第59-69页
     ·网页去重实验第59-60页
     ·中文分词实验第60-62页
     ·基于SVM 的领域文本分类实验第62-63页
     ·基于语义理解的Bayesian-Boosting 情感分类实验第63-64页
     ·基于三层次特征空间和两阶段聚类的人名消歧实验第64-69页
   ·本章小结第69-71页
结论第71-72页
参考文献第72-79页
致谢第79页

论文共79页,点击 下载论文
上一篇:基于时间区间的RFID复杂事件处理方法的研究
下一篇:基于DOM建模的网页木马检测的分类器设计