首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于语句相似度的中文文本复制检测技术研究

摘要第4-5页
ABSTRACT第5页
目录第6-8页
第一章 绪论第8-11页
    1.1 复制检测技术的应用背景第8-9页
    1.2 研究内容第9页
    1.3 论文结构第9-11页
第二章 文本复制检测技术研究第11-19页
    2.1 文本复制检测问题及评价标准第11-12页
        2.1.1 文本复制检测问题第11页
        2.1.2 文本复制检测评价标准第11-12页
    2.2 文本复制检测技术第12-13页
        2.2.1 基于串匹配的文本复制检测技术第12-13页
        2.2.2 基于特征描述的复制检测技术第13页
        2.2.3 基于语义的复制检测技术第13页
    2.3 基于特征描述的复制检测技术第13-18页
        2.3.1 基于词频特征的向量空间模型和TF-IDF技术第14-16页
        2.3.2 基于词形和词序的句子相似度计算模型第16-18页
        2.3.3 基于相关频率模型的SCAM模型第18页
    2.4 本章小结第18-19页
第三章 基于相似度的文本复制检测技术改进第19-38页
    3.1 基于知网的词语相似度改进算法第19-27页
        3.1.1 词语相似度计算技术研究现状第19-20页
        3.1.2 知网和KDML知识描述语言第20-21页
        3.1.3 知网中义原相似度改进算法第21-24页
        3.1.4 基于知网的词语相似度改进算法第24-27页
    3.2 基于词语结构和词序的文本相似度改进算法第27-36页
        3.2.1 词语语义特征提取方法第27-31页
        3.2.2 局部结构特征提取方法第31-33页
        3.2.3 词语结构相似度计算方法第33页
        3.2.4 词序相似度计算方法第33-35页
        3.2.5 综合相似度计算方法第35-36页
    3.3 本章小结第36-38页
第四章 文本复制检测系统实现及算法验证第38-54页
    4.1 文本复制检测系统实现第38-43页
        4.1.1 文本复制检测系统总体设计第38-39页
        4.1.2 文本复制检测系统架构设计第39-40页
        4.1.3 文本复制检测系统主要功能模块第40-43页
    4.2 基于知网的词语相似度改进算法实验及结果分析第43-47页
        4.2.1 义原相似度实验第44页
        4.2.2 词语相似度实验第44-47页
    4.3 基于词语结构和词序的相似度改进算法实验及结果分析第47-53页
        4.3.1 测试数据构建第47-48页
        4.3.2 算法参数训练第48-49页
        4.3.3 实验结果与分析第49-53页
    4.4 本章小结第53-54页
第五章 总结与展望第54-56页
    5.1 主要研究工作总结第54页
    5.2 未来工作展望第54-56页
参考文献第56-59页
致谢第59-60页
攻读硕士学位期间发表的学术论文目录第60页

论文共60页,点击 下载论文
上一篇:基于用户评论的个性化产品推荐系统
下一篇:移动互联网中海量用户数据的分析与研究