首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文文本分类特征选择和特征加权方法研究

摘要第1-4页
ABSTRACT第4-8页
1 绪论第8-13页
   ·研究背景与意义第8-9页
   ·国内外研究现状第9-11页
     ·文本分类的研究现状第9-10页
     ·非平衡数据分类的研究现状第10-11页
   ·本文的研究内容和组织结构第11-13页
     ·本文的研究内容第11-12页
     ·本文的组织结构第12-13页
2 文本分类相关技术第13-19页
   ·序言第13页
   ·文本预处理第13页
   ·文本表示模型第13-14页
   ·特征降维第14-15页
   ·特征加权第15页
   ·文本分类算法第15-17页
     ·朴素贝叶斯算法第15-16页
     ·K-最近邻算法第16页
     ·支持向量机算法第16页
     ·Rocchio 算法第16-17页
   ·文本分类系统的评价指标第17-18页
   ·本章总结第18-19页
3 信息增益方法的改进和综合特征分布比率的特征选择方法第19-27页
   ·序言第19页
   ·特征选择的过程第19页
   ·常用的特征选择方法第19-21页
     ·文档频度第19-20页
     ·互信息第20页
     ·X~2统计第20页
     ·文本证据权第20-21页
     ·信息增益第21页
   ·信息增益方法的不足与改进第21-23页
   ·综合特征分布比率的特征选择方法第23-26页
   ·本章小结第26-27页
4 TF-IDF 特征加权方法的不足与改进第27-32页
   ·序言第27页
   ·布尔权重第27页
   ·TF 权重第27页
   ·IDF 权重第27-28页
   ·TF-IDF 权重方法第28页
   ·TF-IDF 的不足第28-30页
   ·TF-IDF 的改进第30-31页
   ·本章总结第31-32页
5 实验及结果分析第32-55页
   ·序言第32页
   ·分类实验系统介绍第32-35页
   ·相对平衡的数据集上的对比实验第35-47页
     ·实验数据第35页
     ·KNN 算法中 K 值的确定第35-36页
     ·特征选择方法的对比实验第36-41页
     ·特征加权方法对比实验第41-47页
   ·非平衡数据集上的对比实验第47-53页
     ·实验数据第47页
     ·评价指标第47-48页
     ·特征选择方法对比实验第48-50页
     ·特征加权方法对比实验第50-53页
   ·本章小结第53-55页
6 总结与展望第55-57页
   ·本文总结第55页
   ·下一步研究工作第55-57页
致谢第57-58页
参考文献第58-62页
附录第62页
 A. 作者在攻读学位期间发表的论文目录第62页
 B. 作者在攻读硕士学位期间所参与的科研课题第62页

论文共62页,点击 下载论文
上一篇:基于综合特征和显著点的图像检索方法研究
下一篇:射频识别防碰撞算法研究