中文文本自动分类研究与应用

摘要	第1-6页
Abstract	第6-10页
1 绪论	第10-17页
·课题背景及意义	第10页
·文本分类系统的研究现状	第10-13页
·文本分类系统的问题描述	第13-14页
·系统任务	第13页
·评价方式	第13-14页
·本文的研究内容与研究方法	第14-15页
·本文的内容安排	第15-17页
2 中文文本自动分类的技术介绍	第17-26页
·文本分类的相关定义	第17页
·文本分类的两种类型	第17-18页
·机器学习方法	第18页
·向量空间模型	第18-21页
·项权重	第19页
·向量间相似度度量	第19-20页
·向量空间模型的优势	第20-21页
·中文自动分词	第21-26页
·基于知识的分词方法	第21页
·基于统计的分词方法	第21-22页
·基于词典匹配的分词方法	第22-23页
·消除歧义	第23-24页
·未登录词	第24-26页
3 文本分类的关键技术	第26-33页
·项的权重	第26-27页
·特征选择	第27-29页
·DF	第27页
·IG信息增益	第27-28页
·MI互信息	第28-29页
·χ~2统计量(也叫CHI)	第29页
·常用分类算法	第29-30页
·文本分类模型	第29-30页
·几种分类算法的研究	第30页
·文本分类的评估指标	第30-32页
·本章小结	第32-33页
4 中文文本自动分类系统的设计与实现	第33-55页
·系统简介	第33-34页
·中文自动分词	第34-38页
·本系统的分词工具	第34-35页
·分词词典	第35-37页
·分词算法	第37-38页
·分词算法的切分效果示例	第38页
·文本信息统计模块	第38-42页
·文本信息统计模块的意义	第39页
·文本信息统计模块中的类结构	第39-41页
·文本信息统计模块的工作流程	第41-42页
·特征选择	第42-46页
·传统的MI	第42页
·改进的MI	第42-43页
·传统的组合特征选择	第43-45页
·改进的组合特征提取	第45-46页
·特征权重计算	第46-47页
·传统的TFIDF权重	第46-47页
·分类算法	第47-52页
·传统的KNN算法	第47-48页
·KNN算法的特点	第48-49页
·改进的KNN算法	第49-52页
·评价方式	第52-53页
·本章小结	第53-55页
5 实验及分析	第55-71页
·实验所用语料集	第55-56页
·改进的MI特征选择算法	第56-58页
·改进的组合特征选择算法效果	第58-61页
·改进的KNN算法分类效果	第61-66页
·各模块改进算法组合效果	第66-71页
6 总结与展望	第71-73页
·总结	第71-72页
·展望	第72-73页
参考文献	第73-78页
致谢	第78页