基于领域本体树结构的C语言试题库查重研究

摘要	第5-6页
ABSTRACT	第6页
第1章绪论	第9-14页
1.1 课题背景、意义及特点	第9-11页
1.1.1 课题背景	第9页
1.1.2 课题意义	第9页
1.1.3 课题特点	第9-11页
1.2 国内外研究现状	第11-12页
1.3 研究内容和论文结构	第12-14页
第2章汉语自动分词	第14-21页
2.1 自动分词基本问题	第14-16页
2.1.1 汉语分词规范	第14-15页
2.1.2 歧义切分	第15-16页
2.1.3 未登录词	第16页
2.2 中文分词基本算法	第16-18页
2.2.1 基于字符串匹配的算法	第16-17页
2.2.2 基于统计的算法	第17-18页
2.3 CHMM分词方法与工具	第18-21页
2.3.1 CHMM分词方法	第18-19页
2.3.2 ICTCLAS具	第19-21页
第3章词语和句子相似度基本算法	第21-41页
3.1 词语相似度计算方法	第21-36页
3.1.1 基于同义词词林的方法	第21-24页
3.1.2 基于知网的方法	第24-30页
3.1.3 基于领域本体的方法	第30-36页
3.2 句子相似度计算几种常用方法	第36-41页
3.2.1 基于相同词汇的算法	第36-37页
3.2.2 基于向量空间的算法	第37-38页
3.2.3 基于编辑距离的算法	第38-39页
3.2.4 基于句子结构的算法	第39-41页
第4章基于领域本体的C语言重复试题计算	第41-55页
4.1 领域本体的构建与解析	第41-46页
4.1.1 C语言领域本体的构建方法	第41-42页
4.1.2 C语言领域本体的构建过程	第42-44页
4.1.3 Jena对C语言领域本体的解析	第44-46页
4.2 分词工具的应用	第46-52页
4.2.1 Java分词系统ICTCLAS4J	第46页
4.2.2 用户字典和词性的扩充	第46-52页
4.3 重复C语言试题计算	第52-55页
4.3.1 操作代价的定义	第52-53页
4.3.2 相似度的归一化处理	第53-55页
第5章实验结果和分析	第55-59页
5.1 测试集与指标	第55页
5.2 查重实验与结果	第55-57页
5.3 实验结果分析	第57-59页
第6章总结与展望	第59-61页
参考文献	第61-64页
攻读学位期间公开发表论文	第64-65页
致谢	第65-66页
作者简介	第66页