| 摘要 | 第1-5页 |
| Abstract | 第5-11页 |
| 第一章 绪论 | 第11-16页 |
| ·文本自动分类研究的背景与意义 | 第11页 |
| ·文本自动分类技术发展状况 | 第11-14页 |
| ·文本分类技术的定义 | 第11-13页 |
| ·国外研究概况 | 第13-14页 |
| ·国内研究概况 | 第14页 |
| ·本文研究内容与组织结构 | 第14-15页 |
| ·本章小结 | 第15-16页 |
| 第二章 分类知识库的建立 | 第16-24页 |
| ·分类体系的选择 | 第16-17页 |
| ·知识库构建的难点 | 第17-18页 |
| ·知识库的组成 | 第18-20页 |
| ·知识库构建步骤 | 第20-23页 |
| ·知识库的维护 | 第23页 |
| ·本章小结 | 第23-24页 |
| 第三章 自动标引 | 第24-36页 |
| ·文本特征项粒度的选取 | 第24-25页 |
| ·文本预处理 | 第25-26页 |
| ·自动分词 | 第26-31页 |
| ·自动分词的难点 | 第26-27页 |
| ·分词算法 | 第27-31页 |
| ·特征项选取 | 第31-33页 |
| ·新词识别 | 第33页 |
| ·自动标引评价 | 第33-35页 |
| ·本章小结 | 第35-36页 |
| 第四章 自动分类 | 第36-46页 |
| ·自动分类深度 | 第36页 |
| ·特征项的权重计算 | 第36-41页 |
| ·文档频数(Document Frequency,DF) | 第37页 |
| ·互信息(Mutual Information,MI) | 第37-38页 |
| ·信息增益(Information Gain,IG) | 第38-39页 |
| ·对数似然比(Log Likelihood Ratio,LLR) | 第39页 |
| ·Dice系数 | 第39-41页 |
| ·自动分类算法 | 第41-43页 |
| ·分类算法测试 | 第43-44页 |
| ·本章小结 | 第44-46页 |
| 第五章自动分类系统设计与实现 | 第46-55页 |
| ·系统框架 | 第46-50页 |
| ·评测标准 | 第50-53页 |
| ·总结与展望 | 第53-55页 |
| 参考文献 | 第55-57页 |
| 致谢 | 第57页 |