首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向小样本的文本分类模型及算法研究

摘要第5-7页
abstract第7-9页
第一章 绪论第14-25页
    1.1 研究背景第14-15页
    1.2 研究历史第15-17页
    1.3 研究意义第17-18页
        1.3.1 信息组织第17页
        1.3.2 新闻分类第17页
        1.3.3 数字图书馆第17-18页
        1.3.4 文本情感分类第18页
        1.3.5 有害信息过滤第18页
    1.4 主要挑战及研究现状第18-22页
        1.4.1 高维稀疏问题第18-19页
        1.4.2 样本不均衡问题第19-20页
        1.4.3 小样本问题第20-21页
        1.4.4 大样本问题第21页
        1.4.5 分类器效率问题第21-22页
    1.5 本文的研究内容第22-23页
    1.6 本文的结构安排第23-24页
    1.7 本章小结第24-25页
第二章 相关研究第25-45页
    2.1 问题描述第25-26页
    2.2 特征定义第26-28页
    2.3 特征降维第28-35页
        2.3.1 特征选择第29-33页
            2.3.1.1 过滤式方法第29-31页
            2.3.1.2 封装式方法第31-32页
            2.3.1.3 嵌入式方法第32-33页
        2.3.2 特征抽取第33-35页
            2.3.2.1 潜在语义索引第33页
            2.3.2.2 主成份分析第33-34页
            2.3.2.3 线性判别分析第34-35页
    2.4 文本表示第35-37页
        2.4.1 布尔模型第35-36页
        2.4.2 向量空间模型第36-37页
    2.5 分类算法第37-41页
        2.5.1 朴素贝叶斯算法第37-38页
        2.5.2 KNN算法第38-39页
        2.5.3 支持向量机第39-41页
    2.6 评估方法第41-43页
        2.6.1 精确率和召回率第42页
        2.6.2 度量第42页
        2.6.3 微平均和宏平均第42-43页
    2.7 测试集第43-44页
    2.8 本章小结第44-45页
第三章 特征子集评估方法研究第45-70页
    3.1 引言第45-46页
    3.2 相关工作第46-48页
        3.2.1 特征选择评价方法第46-47页
        3.2.2 聚类算法评价方法第47-48页
    3.3 已有的聚类评价指标第48-51页
    3.4 文本提出的LW指标第51-53页
    3.5 实验第53-69页
        3.5.1 实验数据及设置第53-55页
        3.5.2 实验结果及分析第55-67页
            3.5.2.1 随机选择特征实验第55-59页
            3.5.2.2 特征选择比较实验第59-67页
        3.5.3 参数分析第67-69页
    3.6 本章小结第69-70页
第四章 特征选择算法研究第70-82页
    4.1 引言第70-71页
    4.2 相关工作第71-73页
    4.3 文本提出的SFS-LW特征选择算法第73-74页
    4.4 实验第74-81页
        4.4.1 实验数据及设置第74-75页
        4.4.2 实验结果及分析第75-81页
        4.4.3 参数分析第81页
    4.5 本章小结第81-82页
第五章 大规模实例选择算法研究第82-105页
    5.1 引言第82-83页
    5.2 相关工作第83-85页
    5.3 现有方法分析第85-87页
        5.3.1 聚类型选择算法第86页
        5.3.2 近邻型选择算法第86-87页
        5.3.3 几何型选择算法第87页
    5.4 文本提出的SE实例选择算法第87-91页
    5.5 实验第91-104页
        5.5.1 实验数据及设置第91-92页
        5.5.2 实验结果及分析第92-101页
        5.5.3 参数分析第101-104页
    5.6 本章小结第104-105页
第六章 文本分类引力模型及算法研究第105-122页
    6.1 引言第105-106页
    6.2 相关工作第106-107页
    6.3 质心分类及其改进算法第107-111页
        6.3.1 原质心分类算法第107-108页
        6.3.2 推拉算法第108-109页
        6.3.3 大间隔推拉算法第109页
        6.3.4 类特征质心算法第109-110页
        6.3.5 现有算法存在的问题第110-111页
    6.4 本文提出的引力模型第111-114页
        6.4.1 引力模型定义第111-112页
        6.4.2 引力模型学习算法第112-114页
    6.5 实验第114-121页
        6.5.1 实验数据及设置第114-115页
        6.5.2 多分类实验第115-116页
        6.5.3 二分类实验第116-120页
        6.5.4 参数分析第120-121页
    6.6 本章小结第121-122页
第七章 求解引力模型的最小球算法研究第122-132页
    7.1 引言第122页
    7.2 引力模型求解目标第122-123页
    7.3 最小球理论及算法第123-125页
    7.4 实验第125-131页
        7.4.1 实验数据及设置第125-126页
        7.4.2 实验结果及分析第126-131页
    7.5 本章小结第131-132页
第八章 结束语第132-134页
致谢第134-136页
参考文献第136-152页
攻读博士学位期间取得的成果第152-153页

论文共153页,点击 下载论文
上一篇:复杂网络数据模式挖掘与演化分析研究
下一篇:基于粒计算理论的网络安全行为分析关键技术研究