首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于海量科技文献的自动聚类研究与设计

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第10-15页
    1.1 研究背景第10-11页
    1.2 问题和难点第11页
    1.3 国内外研究现状第11-13页
    1.4 本文主要工作第13页
    1.5 本文的组织结构第13-15页
第二章 基于海量科技文献自动聚类的研究第15-30页
    2.1 文本聚类知识架构介绍第15-16页
    2.2 聚类特征的选取第16-20页
        2.2.1 科技文献特征分析第16-17页
        2.2.2 中文文本词性分析第17-18页
        2.2.3 文本特征提取方法第18-20页
    2.3 聚类技术分析第20-24页
        2.3.1 文本在计算机中的表示模型第20-21页
        2.3.2 文本间相似度的度量第21-22页
        2.3.3 聚类算法研究第22-24页
    2.4 大数据技术分析第24-27页
    2.5 科技文献聚类后处理第27-29页
    2.6 本章结论第29-30页
第三章 基于海量科技文献的自动聚类设计第30-42页
    3.1 海量科技文献的聚类算法流程设计第30-31页
    3.2 科技文献的爬取和存储第31-32页
    3.3 文本预处理第32-34页
    3.4 文本聚类特征选取第34-36页
        3.4.1 名词提取第34-35页
        3.4.2 TF-IDF特征加权第35-36页
    3.5 聚类过程设计第36-40页
        3.5.1 canopy改进后的k-means算法第36-38页
        3.5.2 聚类算法的分布式聚类设计第38-40页
    3.6 对聚类结果的信息抽取第40-41页
    3.7 本章结论第41-42页
第四章 基于海量科技文献自动聚类实现第42-57页
    4.1 系统模块介绍第42-43页
    4.2 模块功能的实现第43-49页
        4.2.1 聚类样本模块第43-45页
        4.2.2 聚类预处理模块第45-46页
        4.2.3 聚类特征生成模块第46-47页
        4.2.4 聚类模块第47-48页
        4.2.5 聚类后处理模块第48-49页
    4.3 系统环境的搭建第49-51页
    4.4 聚类评估第51-56页
        4.4.1 运算效率评估第51-53页
        4.4.2 算法效果评估第53-56页
    4.5 本章结论第56-57页
第五章 结语第57-59页
    5.1 论文工作总结第57-58页
    5.2 进一步的研究工作第58-59页
参考文献第59-61页
致谢第61页

论文共61页,点击 下载论文
上一篇:基于多标签信息的特征向量映射算法研究
下一篇:基于IVCE的资源调度系统的设计与实现