首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文文本分类特征选择方法的研究与实现

摘要第5-6页
ABSTRACT第6-7页
符号对照表第10-11页
缩略语对照表第11-15页
第一章 绪论第15-19页
    1.1 项目背景及意义第15-16页
    1.2 国内外研究现状第16-17页
    1.3 本文的主要工作第17页
    1.4 本文章节安排第17-19页
第二章 文本分类相关理论与算法第19-35页
    2.1 文本分类相关的技术领域第19-20页
    2.2 文本分类概述第20-22页
        2.2.1 文本分类定义第20页
        2.2.2 文本分类特点第20-21页
        2.2.3 文本分类流程第21-22页
    2.3 文本预处理第22-23页
        2.3.1 中文分词第22-23页
        2.3.2 停用词处理第23页
    2.4 文本表示方法第23-26页
        2.4.1 空间向量模型第23-25页
        2.4.2 概率模型第25-26页
        2.4.3 布尔模型第26页
    2.5 特征降维第26-27页
        2.5.1 特征变换第27页
        2.5.2 特征选择第27页
    2.6 特征权重计算第27-28页
    2.7 文本分类算法第28-32页
        2.7.1 朴素贝叶斯算法第28-29页
        2.7.2 Rocchio算法第29页
        2.7.3 KNN算法第29-30页
        2.7.4 支持向量机算法第30-32页
    2.8 评估方法第32-34页
        2.8.1 查准率和查全率第32-33页
        2.8.2 宏平均和微平均第33页
        2.8.3 F值第33-34页
    2.9 本章总结第34-35页
第三章 特征选择方法研究第35-47页
    3.1 特征选择方法应具备的特点第35页
    3.2 传统的特征选择方法第35-38页
        3.2.1 文档频率(DF)第35-36页
        3.2.2 信息增益(IG)第36页
        3.2.3 互信息(MI)第36-37页
        3.2.4 卡方统计(CHI)第37页
        3.2.5 期望交叉熵(ECE)第37-38页
    3.3 特征选择方法比较第38页
    3.4 本文特征选择方法第38-45页
        3.4.1 限制文档频的词频第38-39页
        3.4.2 类内均匀度第39页
        3.4.3 特征词全局类别区分度第39-41页
        3.4.4 综合衡量指标第41页
        3.4.5 算法描述第41-42页
        3.4.6 实验数据及分析第42-45页
    3.5 本章小结第45-47页
第四章 中文文本分类系统的设计与实现第47-57页
    4.1 系统实现的目的和意义第47页
    4.2 系统设计目标第47页
    4.3 体系框架设计第47-48页
    4.4 系统功能模块设计第48-49页
    4.5 功能模块实现第49-55页
        4.5.1 预处理模块第49-50页
        4.5.2 特征选择模块第50-51页
        4.5.3 文本表示模块第51-52页
        4.5.4 构造分类器模块第52-53页
        4.5.5 分类模块第53-55页
        4.5.6 性能评估模块第55页
    4.6 本章小结第55-57页
第五章 实验设计与分析第57-65页
    5.1 实验介绍第57页
    5.2 实验环境和数据集第57-58页
        5.2.1 实验环境第57页
        5.2.2 实验数据集第57-58页
    5.3 实验界面第58-59页
    5.4 实验结果与分析第59-64页
    5.5 本章小结第64-65页
第六章 总结与展望第65-67页
    6.1 工作总结第65页
    6.2 展望第65-67页
参考文献第67-69页
致谢第69-71页
作者简介第71-72页

论文共72页,点击 下载论文
上一篇:网络舆情监控与分析系统的设计与实现
下一篇:基于概要模型的数据流聚合技术研究