首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

非均衡文本分类的特征选择研究

摘要第1-4页
Abstract第4-8页
第一章 绪论第8-12页
   ·研究背景第8-9页
   ·研究现状与本文研究内容第9-11页
   ·本研究论文的框架第11-12页
第二章 文本分类及项技术第12-21页
   ·文本预处理技术第12-13页
     ·提取词条第12页
     ·构建文档模型第12-13页
   ·特征选择技术第13-15页
     ·频率统计方法第13-14页
     ·信息增益第14页
     ·互信息第14-15页
     ·CHI统计第15页
     ·期望交叉熵第15页
   ·文本的分类第15-20页
     ·文本分类算法第15-19页
     ·文本分类的评价指标第19-20页
   ·非均衡文本分类关键问题第20-21页
第三章 非均衡文本分类的常用特征选择算法第21-25页
   ·DFICF特征选择算法第21-22页
     ·DFICF算法的描述第21页
     ·DFICF算法的优点第21-22页
     ·DFICF算法的不足第22页
   ·改进型特征选择算法类条件MI第22-24页
     ·改进型类条件MI算法的描述第22-23页
     ·改进型类条件MI算法的优点第23页
     ·改进型类条件MI算法的不足第23-24页
   ·非均衡文本分类特征选择算法仍存在的问题第24-25页
第四章 非均衡文本分类的改进型特征选择算法TIM第25-28页
   ·TF对特征评价作用第25页
   ·特征的ICF对类别区分作用第25-26页
   ·MI对小类别特征选择的优势第26页
   ·TIM特征选择算法第26-28页
第五章 TIM特征选择算法实验结果比较与分析第28-44页
   ·实验过程第28-30页
     ·语料准备第28页
     ·文本预处理第28-30页
     ·构建特征向量空间第30页
     ·特征选择第30页
     ·分类第30页
   ·实验结果与分析第30-44页
     ·标准MI特征选择算法分类结果与分析第31-33页
     ·DFICF特征选择算法分类结果与分析第33-36页
     ·类条件MI特征选择算法分类结果与分析第36-39页
     ·TIM特征选择算法分类结果与分析第39-42页
     ·四种不同特征选择算法分类效果对比分析第42-44页
第六章 总结与展望第44-46页
   ·本研究总结第44-45页
   ·未来研究展望第45-46页
参考文献第46-49页
在读期间发表的学术论文和研究成果第49-50页
致谢第50-51页

论文共51页,点击 下载论文
上一篇:南京市新生代农民工体育意识与行为现状调查与分析研究
下一篇:基于SEARN框架的中文句法分析技术研究