多层次中文文本分类技术的研究

第1章引言	第1-12页
·研究背景	第7-8页
·文本自动分类概述	第8-9页
·概念	第8页
·发展历程	第8-9页
·文本自动分类的主要研究方法	第9-10页
·自动聚类技术	第9页
·自动归类技术	第9-10页
·作者的主要工作	第10-11页
·论文内容简介	第11-12页
第2章自动分类的国内外研究概况	第12-28页
·自动分类中的基本概念	第12-13页
·自动分类中的几个重要技术环节	第13-14页
·特征加权算法	第14-17页
·频率算法TF	第14-15页
·反文档频率算法IDF	第15-16页
·其它影响权重的信息	第16-17页
·缩减维数算法	第17-19页
·文档频率 Document Frequency	第17页
·信息获取 Information Gain	第17-18页
·互信息 Mutual Information	第18页
·统计量CHI	第18-19页
·分类器设计	第19-28页
·纯粹贝叶斯法 Na?ve Bayes	第19-20页
·2 最大熵模型 Maximum Entropy Model	第20-21页
·最近邻法 K-Nearest Neighbor	第21-22页
·神经元网络法 Neutral Network	第22页
·支持向量机法 Support Vector Machines	第22-24页
·向量空间模型 Vector Space Model	第24-25页
·决策树 Decision Tree	第25-26页
·小结-Bag of Word的可行性	第26-28页
第3章综合加权的特征提取算法	第28-35页
·传统权重算法的不足	第28-30页
·综合加权的特征提取算法	第30-33页
·使用DI的改进算法	第30-32页
·低频高权特征LFHW	第32-33页
·特征重要度的测试TIT	第33-35页
第4章多层次分类算法	第35-40页
·概念	第35页
·意义	第35页
·层次分类	第35-40页
·多层次的分类体系	第35-37页
·多层次分类与单层分类的比较	第37-38页
·构造多层次模型	第38-40页
第5章分类与检索	第40-43页
·检索的定义	第40页
·检索的意义	第40-41页
·检索的主要方法	第41-42页
·自动分类对检索的意义	第42-43页
第6章系统的设计与实现	第43-66页
·系统简介	第43-45页
·系统总体流程图	第45页
·系统分类体系	第45-48页
·系统核心模块	第48-66页
·词典及特征集的构造	第48-52页
·预处理模块	第52-57页
·特征提取模块	第57-61页
·多层次的训练模块	第61-62页
·多层次的识别模块	第62-65页
·系统维护	第65-66页
第7章系统评测	第66-77页
·测试目的	第66页
·测试目标	第66-70页
·分类系统的参数调整	第66页
·性能指标测试	第66-70页
·测试的环境和条件	第70页
·分类的数据集	第70-71页
·测试方案	第71-77页
·开放式和封闭式测试	第71页
·对分类性能的影响程度测试	第71-76页
·多层次算法的实验结果	第76-77页
第8章结论与展望	第77-78页
参考文献	第78-82页
致谢、声明	第82-83页
附录1	第83-88页
附录2	第88-89页
作者简历	第89页