目录 | 第1-8页 |
0 引言 | 第8页 |
1 系统构建背景 | 第8-16页 |
·数据挖掘与文本挖掘 | 第8-12页 |
·中文文本挖掘的挑战 | 第12-13页 |
·构建中文文本挖掘系统的需求和设计原则 | 第13-14页 |
·TextMiner系统简介 | 第14-16页 |
2 系统结构与实现方案 | 第16-33页 |
·主体结构 | 第16-21页 |
·TextMiner核心模块的设计技巧 | 第21-33页 |
·利用Factory Method实现类实例的灵活装载与管理 | 第23-25页 |
·利用Abstract Factory为分离方法具体实现提供方便 | 第25-27页 |
·利用Singleton控制实例数量 | 第27-28页 |
·利用XML进行对象数据绑定 | 第28-33页 |
3 各模块理论基础与相关实现 | 第33-59页 |
·分词模块 | 第33-46页 |
·分词方法概览 | 第34-40页 |
·模块划分 | 第40-44页 |
·关于词典 | 第44-46页 |
·调用习惯 | 第46页 |
·特征提取与特征压缩模块 | 第46-53页 |
·文本特征处理概览 | 第46-47页 |
·特征选择与压缩方法 | 第47-50页 |
·实现抽象的特征选择器 | 第50-53页 |
·分类模块 | 第53-59页 |
·文档模型与训练集合建模 | 第53-55页 |
·分类方法 | 第55-58页 |
·抽象分类器的实现 | 第58页 |
·具体分类器的实现 | 第58-59页 |
4 应用分析 | 第59-61页 |
·设计现实系统的各种考虑 | 第59-60页 |
·和现有文本分类系统的松散耦合 | 第60-61页 |
·未完成的工作 | 第61页 |
5 结语 | 第61-62页 |
参考文献 | 第62-64页 |
作者硕士研究生在读期间科研成果简介 | 第64-65页 |
声明 | 第65-66页 |
致谢 | 第66页 |