基于潜在语义索引的文本分类研究与实现
| 摘要 | 第1-5页 |
| Abstract | 第5-8页 |
| 第1章 绪论 | 第8-16页 |
| ·课题背景 | 第8页 |
| ·典型应用 | 第8-9页 |
| ·国内外研究现状 | 第9-13页 |
| ·文本分类技术 | 第9-11页 |
| ·向量空间模型 | 第11-12页 |
| ·潜在语义索引模型 | 第12-13页 |
| ·本文工作 | 第13-14页 |
| ·论文结构安排 | 第14-16页 |
| 第2章 文本分类系统及其优化 | 第16-32页 |
| ·文本分类系统 | 第16-20页 |
| ·引入词语位置信息的LSI权重计算方法 | 第20-24页 |
| ·传统词语权重计算方法 | 第20-22页 |
| ·包含词语位置信息的LSI权值计算方法 | 第22-24页 |
| ·基于词语分布信息的维数约简方法 | 第24-29页 |
| ·传统维数约简方法 | 第24-27页 |
| ·基于词语分布信息的维数约简方法 | 第27-29页 |
| ·实验结果与分析 | 第29-31页 |
| ·本章小结 | 第31-32页 |
| 第3章 基于类别信息的潜在语义分类方法 | 第32-46页 |
| ·潜在语义索引分类方法 | 第32-34页 |
| ·LSI分类方法原理 | 第32-34页 |
| ·潜在语义索引分类方法的缺陷 | 第34页 |
| ·改进的基于类别信息的潜在语义分类方法 | 第34-45页 |
| ·问题的引出 | 第34-35页 |
| ·偏最小二乘回归 | 第35-40页 |
| ·算法原理 | 第40-41页 |
| ·算法推导与描述 | 第41-45页 |
| ·算法时间复杂性分析 | 第45页 |
| ·本章小结 | 第45-46页 |
| 第4章 系统实现及实验结果分析 | 第46-55页 |
| ·语料库的选取 | 第46-48页 |
| ·系统预处理 | 第48-50页 |
| ·实验及结果分析 | 第50-54页 |
| ·本章小结 | 第54-55页 |
| 结论 | 第55-56页 |
| 参考文献 | 第56-60页 |
| 致谢 | 第60页 |