首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于文本特征的手机用户分类方法研究与实现

摘要第5-6页
Abstract第6页
第一章 绪论第9-14页
    1.1 研究背景与意义第9-10页
    1.2 国内外研究现状第10-12页
        1.2.1 文本分类研究现状第10-11页
        1.2.2 分布式计算研究现状第11-12页
    1.3 本文主要研究内容第12-13页
    1.4 本文组织结构第13-14页
第二章 相关技术综述第14-26页
    2.1 文本分类技术第14-22页
        2.1.1 文本分类过程第14-15页
        2.1.2 文本分类算法第15-22页
    2.2 基于Hadoop的分布式技术第22-25页
        2.2.1 基于Hadoop的大数据处理平台第22-24页
        2.2.2 基于Hadoop的分布式数据挖掘技术第24-25页
    2.3 本章小结第25-26页
第三章 基于改进的TFIDF向量加权分类模型第26-36页
    3.1 TFIDF算法概述第26-28页
        3.1.1 传统TFIDF公式的改进第26-28页
    3.2 基于改进的TFIDF向量加权分类模型实现第28-35页
        3.2.2 数据预处理第28-30页
        3.2.3 算法改进第30-32页
        3.2.4 分类模型第32-35页
    3.3 本章小结第35-36页
第四章 基于信息熵的KNN分类模型第36-44页
    4.1 KNN算法概述第36-38页
        4.1.1 传统的KNN算法第36-37页
        4.1.2 计算文本向量之间距离的方法第37-38页
    4.2 基于信息熵的KNN分类算法模型实现第38-43页
        4.2.1 信息熵的引入第38页
        4.2.2 数据预处理第38-40页
        4.2.3 算法改进第40-41页
        4.2.4 分类模型第41-43页
    4.3 本章小结第43-44页
第五章 实验设计与分析第44-55页
    5.1 实验环境的构造第44-47页
        5.1.1 实验环境的系统结构第44-45页
        5.1.2 数据预处理第45-46页
        5.1.3 分词工具第46-47页
    5.2 实验设计第47-48页
        5.2.1 实验数据第47页
        5.2.2 实验方法第47-48页
    5.3 实验结果与分析第48-53页
        5.3.1 算法精确度对比实验第48-52页
        5.3.2 算法速度对比实验第52-53页
        5.3.3 实验结果分析第53页
    5.4 本章小结第53-55页
第六章 总结与展望第55-57页
    6.1 总结第55页
    6.2 展望第55-57页
参考文献第57-60页
攻读硕士学位期间取得的研究成果第60-61页
致谢第61-62页
答辩委员签名的答辩决议书第62页

论文共62页,点击 下载论文
上一篇:凯恩斯主义就业理论及其启示
下一篇:新时期大寨旅游经济研究