文本分类中特征选择的理论分析和算法研究

摘要	第1-5页
Abstract	第5-10页
第1章引言	第10-19页
·背景和历史	第10-14页
·自动文本分类技术	第14-15页
·特征选择技术	第15-16页
·研究目的和意义	第16-17页
·研究内容和贡献	第17页
·本论文的内容安排	第17-19页
第2章文本分类技术	第19-27页
·决策树算法	第19-21页
·朴素贝叶斯	第21-22页
·K 最近邻算法	第22-23页
·支持向量机	第23-25页
·线性最小平方拟合	第25页
·神经网络	第25-27页
第3章特征选择技术	第27-37页
·引言	第27-30页
·过滤型特征选择方法	第30-34页
·基于相互关系度的特征选择	第32-33页
·马尔可夫覆盖过滤算法（KS 算法）	第33-34页
·包装型特征选择方法	第34-37页
第4章基于图的特征选择	第37-56页
·图模型与符号表示	第37-40页
·符号表示	第37-38页
·图模型	第38-40页
·马尔可夫链模型	第40-46页
·中心性（Centrality）	第40-41页
·马尔可夫链模型（Markov Chain Model）	第41-42页
·类别建模	第42-43页
·算法	第43-46页
·基于图的多类别特征结合选择算法	第46-51页
·主要思想	第46-49页
·评分综合	第49-50页
·计算公式	第50-51页
·观察分析和下一步的研究方向	第51-55页
·文档-文档图	第51-53页
·词特征表示	第53-54页
·方差模型的缺陷	第54-55页
·结论	第55-56页
第5章实验结果及分析	第56-76页
·数据集	第56-62页
·20Newsgroup 介绍	第56-58页
·选取三组典型数据进行分类对比	第58-61页
·类别核心词项分布分析	第61-62页
·实验工具	第62-63页
·文本预处理	第62-63页
·分类器	第63页
·实验评估方法	第63-66页
·Recall, precision, accuracy, error rate, fallout	第64-65页
·微平均（Micro-average）和宏平均（macro-average）	第65页
·Break-even point 方法	第65-66页
·F_β量测方法	第66页
·分类正确率	第66页
·实验步骤	第66-67页
·实验结果及其分析	第67-75页
·经验分析	第67-70页
·实验结果评估	第70-75页
·结论	第75-76页
第6章总结和进一步工作	第76-78页
·研究总结	第76页
·需进一步展开的工作	第76-78页
参考文献	第78-82页
致谢	第82-83页
个人简历、在学期间发表的学术论文与研究成果	第83页