可扩展的文本分类系统的核心API的设计与实现

目录	第1-8页
0 引言	第8页
1 系统构建背景	第8-16页
·数据挖掘与文本挖掘	第8-12页
·中文文本挖掘的挑战	第12-13页
·构建中文文本挖掘系统的需求和设计原则	第13-14页
·TextMiner系统简介	第14-16页
2 系统结构与实现方案	第16-33页
·主体结构	第16-21页
·TextMiner核心模块的设计技巧	第21-33页
·利用Factory Method实现类实例的灵活装载与管理	第23-25页
·利用Abstract Factory为分离方法具体实现提供方便	第25-27页
·利用Singleton控制实例数量	第27-28页
·利用XML进行对象数据绑定	第28-33页
3 各模块理论基础与相关实现	第33-59页
·分词模块	第33-46页
·分词方法概览	第34-40页
·模块划分	第40-44页
·关于词典	第44-46页
·调用习惯	第46页
·特征提取与特征压缩模块	第46-53页
·文本特征处理概览	第46-47页
·特征选择与压缩方法	第47-50页
·实现抽象的特征选择器	第50-53页
·分类模块	第53-59页
·文档模型与训练集合建模	第53-55页
·分类方法	第55-58页
·抽象分类器的实现	第58页
·具体分类器的实现	第58-59页
4 应用分析	第59-61页
·设计现实系统的各种考虑	第59-60页
·和现有文本分类系统的松散耦合	第60-61页
·未完成的工作	第61页
5 结语	第61-62页
参考文献	第62-64页
作者硕士研究生在读期间科研成果简介	第64-65页
声明	第65-66页
致谢	第66页