首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于词语权重的中文文本分类算法的研究

摘要第1-5页
ABSTRACT第5-8页
第一章 绪论第8-14页
 §1-1 文本分类研究的背景及意义第8-10页
  1-1-1 文本分类概述第8页
  1-1-2 研究背景及意义第8-10页
 §1-2 文本分类国内外研究现状第10-12页
  1-2-1 文本分类在国外的发展第10-11页
  1-2-2 文本分类在国内的发展第11-12页
 §1-3 课题研究的工作和内容组织第12-14页
  1-3-1 课题研究的内容及主要工作第12页
  1-3-2 论文的章节安排第12-14页
第二章 文本分类的相关技术第14-22页
 §2-1 文本分类的基本概念第14-15页
  2-1-1 文本分类问题描述第14页
  2-1-2 文本分类的技术线路第14-15页
 §2-2 文本表示模型第15-17页
  2-2-1 文本表示方法第15页
  2-2-2 向量空间模型第15-17页
 §2-3 常用特征项提取方法第17-19页
  2-3-1 词频方法DF(Document Frequency: DF)第17-18页
  2-3-2 信息增益方法IG(Information Gain:IG)第18页
  2-3-3 互信息方法MI(Mutual Information:MI)第18页
  2-3-4 X2统计量(CHI)第18-19页
 §2-4 常用的几种分类算法第19-21页
  2-4-1 简单向量距离算法第19页
  2-4-2 KNN(近邻居)算法第19-20页
  2-4-3 朴素贝叶斯算法第20页
  2-4-4 神经网络算法第20-21页
 §2-5 本章小结第21-22页
第三章 词语权重计算方法的改进第22-34页
 §3-1 常用的特征提取方法第22-23页
  3-1-1 文档频数DF第22页
  3-1-2 信息增益第22-23页
  3-1-3 期望交叉熵第23页
  3-1-4 互信息第23页
  3-1-5 X2统计(CHI)第23页
 §3-2 传统的TFIDF 特征权重算法分析第23-25页
 §3-3 传统的TFIDF 特征权重算法改进第25-28页
  3-3-1 传统的TFIDF 特征权重算法的不足第25-26页
  3-3-2 对传统TFIDF 特征权重算法的改进第26-28页
 §3-4 实验结果与分析第28-33页
  3-4-1 实验的介绍第28页
  3-4-2 传统的TFIDF 特征权重算法实验第28-29页
  3-4-3 改进的 TFIDF 特征权重算法实验第29-30页
  3-4-4 特征权重算法改进前与改进后的对比图第30-32页
  3-4-5 特征权重算法的对分类性能的影响第32-33页
 §3-5 本章小结第33-34页
第四章 基于词语权重的文本分类系统的设计与实现第34-45页
 §4-1 文本分类系统实现的目的与意义第34页
 §4-2 文本分类系统框架设计第34-35页
 §4-3 文本分类系统总体结构第35-36页
 §4-4 文本分类系统的功能模块说明第36-42页
  4-4-1 语料库维护第36-37页
  4-4-2 网页预处理第37-39页
  4-4-3 文本表示第39-40页
  4-4-4 基于词语权重的分类模型第40-41页
  4-4-5 训练集和测试集第41-42页
  4-4-6 性能评估模块第42页
 §4-5 文本分类实验第42-45页
  4-5-1 实验环境第42-43页
  4-5-2 实验过程及结果第43-44页
  4-5-3 实验结果分析第44-45页
第五章 总结和展望第45-46页
 §5-1 总结第45页
 §5-2 展望第45-46页
参考文献第46-49页
致谢第49页

论文共49页,点击 下载论文
上一篇:基于P2P的流媒体点播关键技术研究
下一篇:工件图像亚像素边缘检测方法的研究