首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于指纹和语义知识表示的中文文档复制检测方法

摘要第1-6页
Abstract第6-14页
第1章 绪论第14-30页
   ·复制检测技术的出现第14-15页
   ·文档复制检测的定义与分类第15-16页
   ·自然语言文档复制检测的研究现状第16-25页
     ·基于词频统计的文档复制检测方法第17-21页
     ·基于Hash文本块的文档复制检测方法第21-23页
     ·基于语义知识的文档复制检测方法第23-25页
     ·通用的文档复制检测流程第25页
   ·本文的研究意义和应用前景第25-27页
   ·课题主要研究内容第27-28页
   ·论文结构第28-30页
第2章 自然语言处理及语义分析第30-44页
   ·自然语言处理第30-32页
   ·汉语分析的特殊问题第32-36页
   ·语义分析方法第36-43页
     ·词义消歧方法第36-38页
     ·统计句法分析模型第38-41页
     ·语义知识表示方法第41-43页
   ·本章小结第43-44页
第3章 基于指纹的中文文档复制检测方法第44-68页
   ·文本块选取策略第44-46页
   ·分词及Hash函数第46-51页
     ·汉语分词系统及编码第46-50页
     ·Hash函数第50-51页
   ·指纹提取第51-57页
     ·算法描述与性质第52-55页
     ·算法性能分析第55-56页
     ·倒排索引第56-57页
   ·重叠度度量第57-60页
   ·原型系统及实验第60-67页
     ·系统结构及特点第60-61页
     ·实验及性能分析第61-67页
   ·本章小结第67-68页
第4章 汉语全文无指导词义标注方法第68-88页
   ·汉语歧义词特点分析及词义消歧定义第68-70页
   ·知网第70-72页
   ·EM算法第72-74页
   ·改进的汉语无指导词义消歧方法第74-80页
     ·特征提取第74-77页
     ·初始参数估计第77-80页
   ·汉语全文无指导词义标注方法第80-84页
   ·实验及性能分析第84-86页
   ·本章小结第86-88页
第5章 基于概率上下文无关文法的汉语无指导句法分析方法第88-105页
   ·概率上下文无关文法第88-90页
   ·结合上下文相关信息的概率评价函数第90-92页
     ·词类与句法范畴共现信息第91-92页
     ·概率评价函数第92页
   ·句法分析算法第92-94页
   ·概率参数的获取第94-98页
     ·规则概率的获取第94-98页
     ·共现概率的获取第98页
   ·实验及性能分析第98-103页
   ·本章小结第103-105页
第6章 汉语语义知识表示及重叠性度量方法第105-122页
   ·基于框架的语义知识表示第105-112页
     ·词的表示第106页
     ·短语的表示第106-110页
     ·句子的表示第110-112页
   ·文档复制方式的分类及检测第112-117页
   ·面向语义知识表示的重叠性度量第117-118页
   ·实验及性能分析第118-121页
   ·本章小结第121-122页
结论第122-124页
参考文献第124-133页
攻读博士学位期间承担的科研任务与主要成果第133-134页
致谢第134-135页
作者简介第135页

论文共135页,点击 下载论文
上一篇:基于三维重建技术的篦冷机熟料冷却控制模型研究
下一篇:智能集成CAD/CAPP系统关键技术研究