首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

面向高校官网的数据挖掘方法研究

摘要第3-4页
Abstract第4-5页
第1章 绪论第8-13页
    1.1 研究背景第8-9页
    1.2 研究目的与意义第9页
    1.3 国内外研究现状第9-11页
    1.4 本文研究内容第11页
    1.5 本文组织结构第11-13页
第2章 词语相似度计算相关技术第13-22页
    2.1 词语相似度基本概念第13-14页
    2.2 知识库介绍第14-17页
        2.2.1 同义词词林介绍第14-15页
        2.2.2 HowNet介绍第15-16页
        2.2.3 WordNet介绍第16-17页
    2.3 基于知识库的相似度计算方法第17-21页
        2.3.1 基于同义词词林的相似度计算方法第17-19页
        2.3.2 基于HowNet的相似度计算方法第19-20页
        2.3.3 基于WordNet的相似度计算方法第20-21页
    2.4 本章小结第21-22页
第3章 文本处理相关技术第22-28页
    3.1 文本预处理第22-24页
        3.1.1 中文分词第22-23页
        3.1.2 去除停用词第23-24页
    3.2 文本表示第24-25页
        3.2.1 文本表示模型第24-25页
        3.2.2 特征降维第25页
    3.3 文本相似度算法第25-26页
    3.4 KMeans聚类算法第26-27页
    3.5 本章小结第27-28页
第4章 基于路径和词林编码的词语相似度计算研究第28-38页
    4.1 词语相似度算法综述第28页
    4.2 基于路径和词林编码的词语相似度算法第28-31页
        4.2.1 基于PathCoding的海明距离计算公式第29-30页
        4.2.2 基于PathCoding的词语相似度计算公式第30-31页
    4.3 基于改进的词语相似度算法的实验结果及分析第31-37页
        4.3.1 边权重的确定第32-34页
        4.3.2 对比实验结果分析第34-37页
    4.4 本章小结第37-38页
第5章 基于数据挖掘的高校官网数据分析研究第38-50页
    5.1 高校官网数据概述第38-39页
    5.2 高校官网数据预处理第39页
    5.3 高校官网数据短语相似度方法研究第39-44页
        5.3.1 基于树形结构的短语相似度计算第40-41页
        5.3.2 基于CilinSimHash算法的短语相似度计算第41-42页
        5.3.3 基于树形结构与CilinSimHash算法的短语相似度计算第42页
        5.3.4 短语相似度计算实验对比分析第42-43页
        5.3.5 基于短语相似度计算的聚类分析第43-44页
    5.4 高校官网数据分析研究第44-48页
        5.4.1 高校官网数据聚类分析第44-47页
        5.4.2 高校官网指标数据聚类分析第47-48页
    5.5 实验结果分析第48-49页
    5.6 本章小结第49-50页
第6章 总结与展望第50-52页
    6.1 总结第50-51页
    6.2 展望第51-52页
参考文献第52-58页
攻读硕士学位期间的科研成果第58-59页
致谢第59页

论文共59页,点击 下载论文
上一篇:K均值算法中初始聚类中心的确定问题研究
下一篇:面向社交网络特定话题的情感词典自构建方法研究