| 摘要 | 第1-6页 |
| Abstract | 第6-14页 |
| 第1章 绪论 | 第14-30页 |
| ·复制检测技术的出现 | 第14-15页 |
| ·文档复制检测的定义与分类 | 第15-16页 |
| ·自然语言文档复制检测的研究现状 | 第16-25页 |
| ·基于词频统计的文档复制检测方法 | 第17-21页 |
| ·基于Hash文本块的文档复制检测方法 | 第21-23页 |
| ·基于语义知识的文档复制检测方法 | 第23-25页 |
| ·通用的文档复制检测流程 | 第25页 |
| ·本文的研究意义和应用前景 | 第25-27页 |
| ·课题主要研究内容 | 第27-28页 |
| ·论文结构 | 第28-30页 |
| 第2章 自然语言处理及语义分析 | 第30-44页 |
| ·自然语言处理 | 第30-32页 |
| ·汉语分析的特殊问题 | 第32-36页 |
| ·语义分析方法 | 第36-43页 |
| ·词义消歧方法 | 第36-38页 |
| ·统计句法分析模型 | 第38-41页 |
| ·语义知识表示方法 | 第41-43页 |
| ·本章小结 | 第43-44页 |
| 第3章 基于指纹的中文文档复制检测方法 | 第44-68页 |
| ·文本块选取策略 | 第44-46页 |
| ·分词及Hash函数 | 第46-51页 |
| ·汉语分词系统及编码 | 第46-50页 |
| ·Hash函数 | 第50-51页 |
| ·指纹提取 | 第51-57页 |
| ·算法描述与性质 | 第52-55页 |
| ·算法性能分析 | 第55-56页 |
| ·倒排索引 | 第56-57页 |
| ·重叠度度量 | 第57-60页 |
| ·原型系统及实验 | 第60-67页 |
| ·系统结构及特点 | 第60-61页 |
| ·实验及性能分析 | 第61-67页 |
| ·本章小结 | 第67-68页 |
| 第4章 汉语全文无指导词义标注方法 | 第68-88页 |
| ·汉语歧义词特点分析及词义消歧定义 | 第68-70页 |
| ·知网 | 第70-72页 |
| ·EM算法 | 第72-74页 |
| ·改进的汉语无指导词义消歧方法 | 第74-80页 |
| ·特征提取 | 第74-77页 |
| ·初始参数估计 | 第77-80页 |
| ·汉语全文无指导词义标注方法 | 第80-84页 |
| ·实验及性能分析 | 第84-86页 |
| ·本章小结 | 第86-88页 |
| 第5章 基于概率上下文无关文法的汉语无指导句法分析方法 | 第88-105页 |
| ·概率上下文无关文法 | 第88-90页 |
| ·结合上下文相关信息的概率评价函数 | 第90-92页 |
| ·词类与句法范畴共现信息 | 第91-92页 |
| ·概率评价函数 | 第92页 |
| ·句法分析算法 | 第92-94页 |
| ·概率参数的获取 | 第94-98页 |
| ·规则概率的获取 | 第94-98页 |
| ·共现概率的获取 | 第98页 |
| ·实验及性能分析 | 第98-103页 |
| ·本章小结 | 第103-105页 |
| 第6章 汉语语义知识表示及重叠性度量方法 | 第105-122页 |
| ·基于框架的语义知识表示 | 第105-112页 |
| ·词的表示 | 第106页 |
| ·短语的表示 | 第106-110页 |
| ·句子的表示 | 第110-112页 |
| ·文档复制方式的分类及检测 | 第112-117页 |
| ·面向语义知识表示的重叠性度量 | 第117-118页 |
| ·实验及性能分析 | 第118-121页 |
| ·本章小结 | 第121-122页 |
| 结论 | 第122-124页 |
| 参考文献 | 第124-133页 |
| 攻读博士学位期间承担的科研任务与主要成果 | 第133-134页 |
| 致谢 | 第134-135页 |
| 作者简介 | 第135页 |