| 目录 | 第1-8页 |
| 0 引言 | 第8页 |
| 1 系统构建背景 | 第8-16页 |
| ·数据挖掘与文本挖掘 | 第8-12页 |
| ·中文文本挖掘的挑战 | 第12-13页 |
| ·构建中文文本挖掘系统的需求和设计原则 | 第13-14页 |
| ·TextMiner系统简介 | 第14-16页 |
| 2 系统结构与实现方案 | 第16-33页 |
| ·主体结构 | 第16-21页 |
| ·TextMiner核心模块的设计技巧 | 第21-33页 |
| ·利用Factory Method实现类实例的灵活装载与管理 | 第23-25页 |
| ·利用Abstract Factory为分离方法具体实现提供方便 | 第25-27页 |
| ·利用Singleton控制实例数量 | 第27-28页 |
| ·利用XML进行对象数据绑定 | 第28-33页 |
| 3 各模块理论基础与相关实现 | 第33-59页 |
| ·分词模块 | 第33-46页 |
| ·分词方法概览 | 第34-40页 |
| ·模块划分 | 第40-44页 |
| ·关于词典 | 第44-46页 |
| ·调用习惯 | 第46页 |
| ·特征提取与特征压缩模块 | 第46-53页 |
| ·文本特征处理概览 | 第46-47页 |
| ·特征选择与压缩方法 | 第47-50页 |
| ·实现抽象的特征选择器 | 第50-53页 |
| ·分类模块 | 第53-59页 |
| ·文档模型与训练集合建模 | 第53-55页 |
| ·分类方法 | 第55-58页 |
| ·抽象分类器的实现 | 第58页 |
| ·具体分类器的实现 | 第58-59页 |
| 4 应用分析 | 第59-61页 |
| ·设计现实系统的各种考虑 | 第59-60页 |
| ·和现有文本分类系统的松散耦合 | 第60-61页 |
| ·未完成的工作 | 第61页 |
| 5 结语 | 第61-62页 |
| 参考文献 | 第62-64页 |
| 作者硕士研究生在读期间科研成果简介 | 第64-65页 |
| 声明 | 第65-66页 |
| 致谢 | 第66页 |