中文文本自动分类关键技术研究及实现

摘要	第1-5页
Abstract	第5-9页
第一章绪论	第9-14页
·研究背景及意义	第9页
·国内外研究现状	第9-11页
·国外研究现状	第9-10页
·国内研究现状	第10-11页
·本文的主要研究工作	第11-12页
·本文结构组织	第12-14页
第二章中文文本自动分类技术	第14-33页
·文本分类定义	第14页
·文本分类流程	第14-15页
·文本预处理	第15-20页
·文本标记处理	第15-16页
·文本特征的选取	第16页
·文本分词	第16-19页
·停用词的处理	第19-20页
·文本表示模型	第20-23页
·布尔逻辑模型	第20页
·向量空间模型	第20-23页
·概率模型	第23页
·LSA模型	第23页
·特征降维	第23-24页
·文本分类方法	第24-30页
·K最近邻算法	第24-25页
·支持向量机算法	第25-28页
·朴素贝叶斯	第28-29页
·决策树分类算法	第29-30页
·分类性能评估	第30-32页
·查准率和查全率	第30-31页
·F测量	第31页
·宏平均与微平均	第31-32页
·本章小结	第32-33页
第三章特征降维	第33-40页
·特征重构	第33-34页
·特征聚类	第33页
·潜在语义索引	第33-34页
·特征选择	第34-39页
·文档频率	第35-36页
·信息增益	第36页
·互信息	第36-37页
·期望交叉熵	第37-38页
·卡方统计	第38页
·文本证据权	第38-39页
·特征选择方法的比较	第39页
·本章小结	第39-40页
第四章基于类别区分度的特征选择方法	第40-47页
·传统特征选择方法的不足之处	第40页
·类别区分度的概念	第40-42页
·类间离散度	第41页
·类内分散偏差	第41-42页
·类别区分度在特征选择方法中的应用	第42-46页
·对传统特征选择方法的改进	第42-44页
·一种新的类别区分词特征选择方法	第44-46页
·本章小结	第46-47页
第五章中文文本自动分类系统设计与实验结果分析	第47-61页
·中文文本自动分类系统的设计	第47-54页
·文本预处理模块	第48-51页
·特征选择模块	第51-52页
·文本表示模块	第52页
·分类模块	第52-54页
·测试评估模块	第54页
·实验设置及结果分析	第54-60页
·语料库选取	第54页
·参数设置	第54-55页
·MI和MI-CD算法的实验结果对比	第55-56页
·ECE和ECE-CD算法的实验结果对比	第56-58页
·类别区分词特征选择算法的实验结果	第58-60页
·本章小结	第60-61页
第六章总结与展望	第61-63页
·本文的研究总结	第61页
·下一步研究计划	第61-63页
参考文献	第63-68页
攻读学位期间的研究成果	第68-69页
致谢	第69页