首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于领域本体树结构的C语言试题库查重研究

摘要第5-6页
ABSTRACT第6页
第1章 绪论第9-14页
    1.1 课题背景、意义及特点第9-11页
        1.1.1 课题背景第9页
        1.1.2 课题意义第9页
        1.1.3 课题特点第9-11页
    1.2 国内外研究现状第11-12页
    1.3 研究内容和论文结构第12-14页
第2章 汉语自动分词第14-21页
    2.1 自动分词基本问题第14-16页
        2.1.1 汉语分词规范第14-15页
        2.1.2 歧义切分第15-16页
        2.1.3 未登录词第16页
    2.2 中文分词基本算法第16-18页
        2.2.1 基于字符串匹配的算法第16-17页
        2.2.2 基于统计的算法第17-18页
    2.3 CHMM分词方法与工具第18-21页
        2.3.1 CHMM分词方法第18-19页
        2.3.2 ICTCLAS具第19-21页
第3章 词语和句子相似度基本算法第21-41页
    3.1 词语相似度计算方法第21-36页
        3.1.1 基于同义词词林的方法第21-24页
        3.1.2 基于知网的方法第24-30页
        3.1.3 基于领域本体的方法第30-36页
    3.2 句子相似度计算几种常用方法第36-41页
        3.2.1 基于相同词汇的算法第36-37页
        3.2.2 基于向量空间的算法第37-38页
        3.2.3 基于编辑距离的算法第38-39页
        3.2.4 基于句子结构的算法第39-41页
第4章 基于领域本体的C语言重复试题计算第41-55页
    4.1 领域本体的构建与解析第41-46页
        4.1.1 C语言领域本体的构建方法第41-42页
        4.1.2 C语言领域本体的构建过程第42-44页
        4.1.3 Jena对C语言领域本体的解析第44-46页
    4.2 分词工具的应用第46-52页
        4.2.1 Java分词系统ICTCLAS4J第46页
        4.2.2 用户字典和词性的扩充第46-52页
    4.3 重复C语言试题计算第52-55页
        4.3.1 操作代价的定义第52-53页
        4.3.2 相似度的归一化处理第53-55页
第5章 实验结果和分析第55-59页
    5.1 测试集与指标第55页
    5.2 查重实验与结果第55-57页
    5.3 实验结果分析第57-59页
第6章 总结与展望第59-61页
参考文献第61-64页
攻读学位期间公开发表论文第64-65页
致谢第65-66页
作者简介第66页

论文共66页,点击 下载论文
上一篇:高职院校学生顶岗实习现状问题及对策研究--以珠海市某高职院校为例
下一篇:《纽约时报》和《中国日报》对中国反恐事件报道的比较研究