摘要 | 第1-6页 |
Abstract | 第6-14页 |
第1章 绪论 | 第14-30页 |
·复制检测技术的出现 | 第14-15页 |
·文档复制检测的定义与分类 | 第15-16页 |
·自然语言文档复制检测的研究现状 | 第16-25页 |
·基于词频统计的文档复制检测方法 | 第17-21页 |
·基于Hash文本块的文档复制检测方法 | 第21-23页 |
·基于语义知识的文档复制检测方法 | 第23-25页 |
·通用的文档复制检测流程 | 第25页 |
·本文的研究意义和应用前景 | 第25-27页 |
·课题主要研究内容 | 第27-28页 |
·论文结构 | 第28-30页 |
第2章 自然语言处理及语义分析 | 第30-44页 |
·自然语言处理 | 第30-32页 |
·汉语分析的特殊问题 | 第32-36页 |
·语义分析方法 | 第36-43页 |
·词义消歧方法 | 第36-38页 |
·统计句法分析模型 | 第38-41页 |
·语义知识表示方法 | 第41-43页 |
·本章小结 | 第43-44页 |
第3章 基于指纹的中文文档复制检测方法 | 第44-68页 |
·文本块选取策略 | 第44-46页 |
·分词及Hash函数 | 第46-51页 |
·汉语分词系统及编码 | 第46-50页 |
·Hash函数 | 第50-51页 |
·指纹提取 | 第51-57页 |
·算法描述与性质 | 第52-55页 |
·算法性能分析 | 第55-56页 |
·倒排索引 | 第56-57页 |
·重叠度度量 | 第57-60页 |
·原型系统及实验 | 第60-67页 |
·系统结构及特点 | 第60-61页 |
·实验及性能分析 | 第61-67页 |
·本章小结 | 第67-68页 |
第4章 汉语全文无指导词义标注方法 | 第68-88页 |
·汉语歧义词特点分析及词义消歧定义 | 第68-70页 |
·知网 | 第70-72页 |
·EM算法 | 第72-74页 |
·改进的汉语无指导词义消歧方法 | 第74-80页 |
·特征提取 | 第74-77页 |
·初始参数估计 | 第77-80页 |
·汉语全文无指导词义标注方法 | 第80-84页 |
·实验及性能分析 | 第84-86页 |
·本章小结 | 第86-88页 |
第5章 基于概率上下文无关文法的汉语无指导句法分析方法 | 第88-105页 |
·概率上下文无关文法 | 第88-90页 |
·结合上下文相关信息的概率评价函数 | 第90-92页 |
·词类与句法范畴共现信息 | 第91-92页 |
·概率评价函数 | 第92页 |
·句法分析算法 | 第92-94页 |
·概率参数的获取 | 第94-98页 |
·规则概率的获取 | 第94-98页 |
·共现概率的获取 | 第98页 |
·实验及性能分析 | 第98-103页 |
·本章小结 | 第103-105页 |
第6章 汉语语义知识表示及重叠性度量方法 | 第105-122页 |
·基于框架的语义知识表示 | 第105-112页 |
·词的表示 | 第106页 |
·短语的表示 | 第106-110页 |
·句子的表示 | 第110-112页 |
·文档复制方式的分类及检测 | 第112-117页 |
·面向语义知识表示的重叠性度量 | 第117-118页 |
·实验及性能分析 | 第118-121页 |
·本章小结 | 第121-122页 |
结论 | 第122-124页 |
参考文献 | 第124-133页 |
攻读博士学位期间承担的科研任务与主要成果 | 第133-134页 |
致谢 | 第134-135页 |
作者简介 | 第135页 |