一种潜在语义索引差异模型及其应用
摘要 | 第1-4页 |
ABSTRACT | 第4-8页 |
1 绪论 | 第8-15页 |
·研究背景和意义 | 第8-9页 |
·文本分类的研究现状 | 第9-12页 |
·文本分类方法的研究现状 | 第9-10页 |
·分类关键技术的研究现状 | 第10-12页 |
·本文研究工作和内容组织 | 第12-15页 |
·本文研究工作 | 第12-13页 |
·本文组织内容 | 第13-15页 |
2 文本分类 | 第15-28页 |
·引言 | 第15页 |
·Web 文本分类 | 第15-17页 |
·Web 文本分类的定义 | 第15-16页 |
·文本分类过程 | 第16-17页 |
·文本分类的关键技术 | 第17-25页 |
·文本预处理 | 第17-18页 |
·文本的表示 | 第18-19页 |
·权重计算方法 | 第19-21页 |
·降维技术 | 第21-25页 |
·文本分类算法 | 第25-27页 |
·文本分类的评估指标 | 第27-28页 |
3 潜在语义索引模型 | 第28-36页 |
·引言 | 第28页 |
·矩阵的奇异值分解 | 第28-29页 |
·潜在语义索引模型 | 第29-34页 |
·局部潜在语义索引模型(LLSI) | 第31-32页 |
·有监督的潜在语义索引模型(SLSI) | 第32-34页 |
·潜在语义索引差异模型(DLSI) | 第34-36页 |
4 基于DLSI 的医学网页分类 | 第36-59页 |
·引言 | 第36-37页 |
·网页转换 | 第37-39页 |
·数据采集 | 第37-38页 |
·Web 网页内容提取 | 第38-39页 |
·文本分类 | 第39-44页 |
·文本分类方法 | 第39-43页 |
·文本预处理 | 第43-44页 |
·实验 | 第44-57页 |
·医学网页的实验方案及结果 | 第45-53页 |
·标准语料库实验 | 第53-57页 |
·类别相关程度分析 | 第57-59页 |
5 基于DLSI 的医学网页聚类 | 第59-65页 |
·引言 | 第59-60页 |
·FCM 算法和聚类包含度 | 第60-62页 |
·聚类实验 | 第62-65页 |
·实验设计 | 第62-63页 |
·实验结果及分析 | 第63-65页 |
6 结论 | 第65-66页 |
参考文献 | 第66-69页 |
致谢 | 第69-70页 |
附录 攻读硕士期间发表的论文目录 | 第70页 |