首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

数据偏斜条件下个人文本数据分类的研究与实现

摘要第9-10页
ABSTRACT第10-11页
第一章 绪论第12-16页
    1.1 课题研究背景第12-13页
    1.2 国内外研究现状第13-14页
    1.3 本文主要的研究工作第14-15页
        1.3.1 研究目的第14页
        1.3.2 研究内容第14-15页
    1.4 本文的组织结构第15-16页
第二章 个人文本数据分类相关技术研究第16-28页
    2.1 个人数据管理基本概念第16-17页
        2.1.1 个人数据定义第16-17页
        2.1.2 个人数据管理第17页
    2.2 个人文本数据空间第17-19页
        2.2.1 个人文本数据第18页
        2.2.2 个人文本数据空间第18页
        2.2.3 个人文本数据空间的特点第18-19页
    2.3 文本分类相关理论第19-26页
        2.3.1 概述第19-20页
        2.3.2 预处理第20-21页
        2.3.3 文本表示模型第21-22页
        2.3.4 特征降维第22-24页
        2.3.5 常见的分类算法第24-26页
    2.4 本章小结第26-28页
第三章 一种数据偏斜条件下的个人文本数据集分类算法第28-37页
    3.1 基于T-DA算法的特征选择方法第28-34页
        3.1.1 基于文本的TextRank关键词提取算法第28-30页
        3.1.2 针对个人文本数据空间特点的T-DA特征选择方法第30-34页
    3.2 基于词匹配的加权多分类算法第34-36页
        3.2.1 基于词匹配的加权多分类算法思想第34-35页
        3.2.2 基于词匹配的加权多分类器算法第35-36页
    3.3 本章小结第36-37页
第四章 基于标准测试集以及个人实用语料的分类实验第37-48页
    4.1 实验语料简介第37-38页
    4.2 文本分类评估方法第38-41页
        4.2.1 评估方法第38页
        4.2.2 试验算法流程第38-40页
        4.2.3 性能度量第40-41页
    4.3 实验安排第41页
    4.4 实验与结果分析第41-47页
        4.4.1 试验中所涉及到的参数列表第41页
        4.4.2 TextRank算法性能效率对比试验第41-43页
        4.4.3 基于偏斜问题的文档分类实验第43-45页
        4.4.4 多类不均衡多分类实验第45-47页
    4.5 本章小结第47-48页
第五章 个人文本文档分类原型系统的设计与实现第48-59页
    5.1 .系统需求与可行性分析第48-49页
        5.1.1 系统需求分析第48页
        5.1.2 系统可行性分析第48-49页
    5.2 系统开发环境第49页
    5.3 系统概要设计第49-51页
        5.3.1 分类器训练概要设计第50-51页
        5.3.2 分类器分类概要设计第51页
    5.4 系统详细设计第51-58页
        5.4.1 文档判定模块模块详细设计第51-52页
        5.4.2 文本预处理模块详细设计第52-53页
        5.4.3 T-DA特征选择模块详细设计第53-55页
        5.4.4 类特征向量图构造算法模块详细设计第55-56页
        5.4.5 分类模块详细设计第56-57页
        5.4.6 应用界面详细设计第57-58页
    5.5 本章小结第58-59页
第六章 总结与展望第59-61页
    6.1 总结第59-60页
    6.2 展望第60-61页
致谢第61-62页
参考文献第62-66页
作者在学期间取得的学术成果第66页

论文共66页,点击 下载论文
上一篇:面向移动感知数据的学业成绩相关行为模式挖掘
下一篇:基于图像的行人检测算法研究