中英文缩略词对照表 | 第5-8页 |
摘要 | 第8-9页 |
ABSTRACT | 第9-10页 |
前言 | 第11-15页 |
1 研究背景 | 第11-12页 |
2 国内外研究现状 | 第12-13页 |
3 研究目的及意义 | 第13页 |
4 课题来源 | 第13-15页 |
研究内容与方法 | 第15-36页 |
1 开发工具 | 第15-17页 |
1.1 Microsoft visual studio 2010 | 第15页 |
1.2 C++编程语言 | 第15-16页 |
1.3 Qt | 第16-17页 |
1.4 ICTCLAS中文分词系统 | 第17页 |
2 系统架构 | 第17-19页 |
2.1 整体系统架构 | 第17-18页 |
2.2 自动分类系统架构 | 第18-19页 |
3 分类系统的分类流程 | 第19-20页 |
4 系统性能评估指标 | 第20-23页 |
5 分类体系的建立 | 第23-24页 |
6 数据来源 | 第24-26页 |
6.1 语料库样本语料来源 | 第24-26页 |
6.2 待分类信息来源 | 第26页 |
7 分类系统的实现 | 第26-36页 |
7.1 文本表示模型 | 第27-28页 |
7.2 中文分词 | 第28页 |
7.3 词的权重计算 | 第28-30页 |
7.4 特征选择方法 | 第30-33页 |
7.5 分类方法 | 第33-36页 |
结果 | 第36-43页 |
1 确定阈值的测试 | 第36-40页 |
1.1 固定FN数量的测试 | 第36-38页 |
1.2 固定K值的测试 | 第38-40页 |
2 原型和新系统分类效果对比 | 第40-43页 |
讨论 | 第43-45页 |
1 阈值的确定 | 第43页 |
2 系统研发过程中的难题与解决方法 | 第43-45页 |
小结 | 第45-46页 |
1 研究中的创新工作 | 第45页 |
2 将来的工作 | 第45-46页 |
致谢 | 第46-47页 |
参考文献 | 第47-50页 |
综述 | 第50-66页 |
参考文献 | 第64-66页 |
攻读硕士学位期间发表的学位论文 | 第66-67页 |
导师评阅表 | 第67页 |