首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向科技项目的相似度计算和聚类算法研究

摘要第9-10页
ABSTRACT第10-11页
第一章 绪论第14-20页
    1.1 研究背景及意义第14页
    1.2 国内外研究现状第14-17页
        1.2.1 相似度计算研究现状第14-16页
        1.2.2 聚类分析研究现状第16-17页
    1.3 主要研究内容与创新点第17-18页
    1.4 本文的内容安排第18-20页
第二章 科技项目的表示模型和预处理第20-27页
    2.1 向量空间模型第20-21页
        2.1.1 基本概念第20-21页
        2.1.2 特性项的选择第21页
    2.2 基于可拓学的知识表示模型第21-22页
        2.2.1 物元知识表示模型第22页
        2.2.2 基于关系元的知识集关系表示第22页
    2.3 科技项目的知识表示模型第22-23页
    2.4 科技项目预处理第23-26页
        2.4.1 科技项目字段的选取第24页
        2.4.2 中文文本分词和停用词处理第24-25页
        2.4.3 关键词项选择第25-26页
        2.4.4 预处理流程第26页
    2.5 本章小结第26-27页
第三章 科技项目相似度计算第27-39页
    3.1 相似度计算第27-30页
        3.1.1 基于向量空间模型的相似度计算第27-29页
        3.1.2 基于语义理解的相似度计算第29-30页
    3.2 一种基于语义理解的VSM相似度计算方法第30-31页
    3.3 一种改进的基于编辑距离的句子相似度计算方法第31-35页
        3.3.1 编辑距离第31-32页
        3.3.2 改进的基于编辑距离的句子相似度计算方法第32-35页
    3.4 科技项目相似度计算第35-36页
        3.4.1 特征向量权重的动态调整第35-36页
        3.4.2 科技项目相似度计算第36页
    3.5 项目相似度计算实验结果及分析第36-38页
    3.6 本章小结第38-39页
第四章 聚类算法研究第39-53页
    4.1 聚类技术第39-40页
    4.2 主要聚类方法研究第40-43页
        4.2.1 划分方法第40-41页
        4.2.2 层次方法第41-42页
        4.2.3 其他聚类方法第42-43页
    4.3 一种基于双阈值的最邻近项目聚类算法第43-51页
        4.3.1 常用聚类算法的不足第43-44页
        4.3.2 双阈值最近邻聚类算法第44-46页
        4.3.3 阈值的设定第46-47页
        4.3.4 实验结果及分析第47-51页
    4.4 聚类在科技项目查重系统中的应用及效果第51-52页
    4.5 本章小结第52-53页
第五章 科技项目相似性检测系统实现第53-62页
    5.1 系统体系架构第53-54页
    5.2 知识表示索引构建模块第54-55页
    5.3 相似度计算模块第55-56页
    5.4 聚类模块第56-57页
    5.5 判定模块第57页
    5.6 系统应用实现第57-61页
    5.7 本章小结第61-62页
第六章 总结和展望第62-64页
    6.1 本文的总结第62页
    6.2 展望第62-64页
致谢第64-65页
参考文献第65-69页
附录第69页

论文共69页,点击 下载论文
上一篇:多量子系统无退相干子空间及伴随阵的计算与控制
下一篇:汉语句群自动划分方法及其在自动文摘中的应用