基于Web的中文文档自动分类的研究与实现

摘要	第1-6页
ABSTRACT	第6-11页
第1章绪论	第11-18页
·课题来源	第11页
·研究的背景和现实意义	第11-12页
·国内外的研究现状	第12-17页
·Web 文本挖掘的研究现状	第12-14页
·Web 文本分类的研究现状	第14-16页
·需要进一步研究的问题	第16-17页
·本课题的主要研究内容	第17-18页
第2章特征提取及文本分类技术的研究	第18-28页
·特征提取	第18-20页
·IG 特征提取	第18-19页
·MI 特征提取	第19页
·CHI 特征提取	第19-20页
·DF 特征提取	第20页
·分类方法	第20-27页
·贝叶斯方法	第20-21页
·K-近邻方法	第21页
·决策树方法	第21-22页
·支持向量机方法	第22-24页
·神经网络方法	第24-25页
·基于投票的方法	第25-26页
·Rocchio 方法	第26页
·Sleeping Expert 方法	第26-27页
·本章小结	第27-28页
第3章系统的总体设计与分析	第28-33页
·系统的总体设计	第28-29页
·系统的评价方法	第29-32页
·特征提取的目的	第29-30页
·相关定义	第30页
·分类算法评价标准	第30-32页
·本章小结	第32-33页
第4章系统的总体实现	第33-47页
·网络蜘蛛的实现	第33-34页
·预处理	第34-37页
·HTML 文本处理加权方案	第34-35页
·分词前的预处理	第35-36页
·HTML 预处理算法	第36-37页
·特征抽取	第37-38页
·特征提取	第38-40页
·特征表示	第40页
·分类器	第40-45页
·经典型工作方式	第41-43页
·偏全型工作方式	第43页
·偏准型工作方式	第43-44页
·混合型工作方式	第44-45页
·评测器	第45-46页
·本章小结	第46-47页
第5章实验结果与分析	第47-57页
·数据集	第47-48页
·实验结果与讨论	第48-56页
·分类方法试验结果	第48-51页
·特征提取实验结果	第51-56页
·本章小结	第56-57页
结论	第57-58页
参考文献	第58-62页
攻读硕士学位期间发表的学术论文	第62-63页
致谢	第63页