首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

K-Means算法的改进及其在微博话题发现中的应用

摘要第4-5页
Abstract第5-6页
第一章 绪论第9-13页
    第一节 研究背景和意义第9-10页
    第二节 国内外研究现状第10-11页
        一、K-Means算法研究现状第10页
        二、微博文本研究现状第10-11页
    第三节 论文的研究内容第11-12页
    第四节 论文的组织结构第12-13页
第二章 聚类介绍及相关技术第13-34页
    第一节 聚类算法的定义和分类第13-20页
        一、聚类算法的定义第13-14页
        二、聚类算法的分类第14-20页
    第二节 微博信息预处理第20-22页
    第三节 微博文本表示第22-30页
        一、文本表示模型第23-25页
        二、特征选择方法第25-28页
        三、文本特征权重计算第28-30页
    第四节 文本相似度第30-33页
    本章小结第33-34页
第三章 K-Means算法改进研究第34-44页
    第一节 K-Means算法介绍第34-37页
        一、K-Means算法的定义第34-35页
        二、K-Means算法的原理和流程第35页
        三、K-means算法面临的主要问题第35-37页
    第二节 算法改进第37-43页
        一、改进K-Means算法的思想第37-38页
        二、改进K-Means算法的相关定义第38-41页
        三、改进K-Means算法的流程第41-43页
    本章小结第43-44页
第四章 微博文本预处理的实现第44-50页
    第一节 预处理实现第44-46页
        一、文本去噪第44-45页
        二、中文分词第45-46页
        三、停用词过滤第46页
    第二节 文本表示过程第46-49页
        一、文本建模的实现第46-47页
        二、特征选择的实现第47-49页
        三、TF-IDF权重计算第49页
    本章小结第49-50页
第五章 实验与结果分析第50-56页
    第一节 实验环境第50页
    第二节 实验过程第50-55页
    本章小结第55-56页
第六章 结论与展望第56-58页
    第一节 研究工作总结第56页
    第二节 未来工作的展望第56-58页
参考文献第58-61页
致谢第61-62页
作者简历第62页

论文共62页,点击 下载论文
上一篇:基于个性化推荐的Android开发能力在线评测系统
下一篇:句子不确定性的判断和分类的研究