首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

文本分类中特征选择的理论分析和算法研究

摘要第1-5页
Abstract第5-10页
第1章 引言第10-19页
   ·背景和历史第10-14页
   ·自动文本分类技术第14-15页
   ·特征选择技术第15-16页
   ·研究目的和意义第16-17页
   ·研究内容和贡献第17页
   ·本论文的内容安排第17-19页
第2章 文本分类技术第19-27页
   ·决策树算法第19-21页
   ·朴素贝叶斯第21-22页
   ·K 最近邻算法第22-23页
   ·支持向量机第23-25页
   ·线性最小平方拟合第25页
   ·神经网络第25-27页
第3章 特征选择技术第27-37页
   ·引言第27-30页
   ·过滤型特征选择方法第30-34页
     ·基于相互关系度的特征选择第32-33页
     ·马尔可夫覆盖过滤算法(KS 算法)第33-34页
   ·包装型特征选择方法第34-37页
第4章 基于图的特征选择第37-56页
   ·图模型与符号表示第37-40页
     ·符号表示第37-38页
     ·图模型第38-40页
   ·马尔可夫链模型第40-46页
     ·中心性(Centrality)第40-41页
     ·马尔可夫链模型(Markov Chain Model)第41-42页
     ·类别建模第42-43页
     ·算法第43-46页
   ·基于图的多类别特征结合选择算法第46-51页
     ·主要思想第46-49页
     ·评分综合第49-50页
     ·计算公式第50-51页
   ·观察分析和下一步的研究方向第51-55页
     ·文档-文档图第51-53页
     ·词特征表示第53-54页
     ·方差模型的缺陷第54-55页
   ·结论第55-56页
第5章 实验结果及分析第56-76页
   ·数据集第56-62页
     ·20Newsgroup 介绍第56-58页
     ·选取三组典型数据进行分类对比第58-61页
     ·类别核心词项分布分析第61-62页
   ·实验工具第62-63页
     ·文本预处理第62-63页
     ·分类器第63页
   ·实验评估方法第63-66页
     ·Recall, precision, accuracy, error rate, fallout第64-65页
     ·微平均(Micro-average)和宏平均(macro-average)第65页
     ·Break-even point 方法第65-66页
     ·F_β量测方法第66页
     ·分类正确率第66页
   ·实验步骤第66-67页
   ·实验结果及其分析第67-75页
     ·经验分析第67-70页
     ·实验结果评估第70-75页
   ·结论第75-76页
第6章 总结和进一步工作第76-78页
   ·研究总结第76页
   ·需进一步展开的工作第76-78页
参考文献第78-82页
致谢第82-83页
个人简历、在学期间发表的学术论文与研究成果第83页

论文共83页,点击 下载论文
上一篇:初中生学业可能自我与问题行为
下一篇:神经元限制性沉默因子对胰岛相关基因调控作用的研究