首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文农业网页去重及相似度判断研究

摘要第3-4页
Abstract第4页
第1章 概述第7-14页
    1.1 研究的背景及意义第7-8页
    1.2 国内外研究现状第8-12页
        1.2.1 国外研究现状第8-10页
        1.2.2 国内研究现状第10-12页
    1.3 研究目标与内容第12-13页
        1.3.1 研究目标第12页
        1.3.2 研究内容第12-13页
    1.4 论文专业术语对照表第13页
    1.5 论文结构第13-14页
第2章 网页去重及相似度判断流程与关键技术第14-26页
    2.1 文本重复及相似概述第14页
    2.2 网页去重及相似度判断流程第14-16页
    2.3 网页去重及相似度判断关键技术第16页
    2.4 样本集来源第16页
    2.5 网页预处理及正文内容提取第16-22页
        2.5.1 网页预处理第16-17页
        2.5.2 网页正文内容提取第17-22页
    2.6 中文分词及特征提取第22-24页
        2.6.1 分词方法选择第22-23页
        2.6.2 特征加权算法第23-24页
    2.7 本章小结第24-26页
第3章 网页去重及相似度判断算法及实现第26-36页
    3.1 MD5 算法第26-27页
        3.1.1 MD5 算法的实现第27页
    3.2 向量空间模型第27-30页
        3.2.1 向量空间模型实现第29-30页
    3.3 基于《知网》的语义相似度计算第30-32页
        3.3.1 《知网》简介第30页
        3.3.2 基于《知网》的词汇语义相似度的计算第30-32页
    3.4 潜在语义分析第32-35页
        3.4.1 LSA 具体实现第33-35页
    3.5 本章小结第35-36页
第4章 中文农业网页去重及相似度判断实验及结果分析第36-48页
    4.1 相似度判断评价标准第36页
    4.2 实验及结果分析第36-47页
        4.2.1 样本集构建第36页
        4.2.2 网页去重实验结果第36页
        4.2.3 不同相似度判断方法的实验结果第36-41页
        4.2.4 相同相似度计算方法不同权重的结果对比第41-43页
        4.2.5 相同相似度判断方法不同权重结果比较第43-44页
        4.2.6 相同权重不同相似度判断方法结果比较第44-47页
    4.3 本章小结第47-48页
第5章 总结与展望第48-50页
    5.1 总结第48页
    5.2 研究展望第48-50页
参考文献第50-54页
致谢第54-55页
作者简历第55页

论文共55页,点击 下载论文
上一篇:奶牛乳腺上皮细胞和奶牛脐带间充质干细胞共培养的试验研究
下一篇:不同滴水处理对中黄35根系生长及花荚形成的影响