潜在语义分类模型的研究

摘要	第1-3页
ABSTRACT	第3-4页
目录	第4-6页
第一章引言	第6-10页
·研究背景	第6-7页
·本文工作	第7-8页
·论文组织	第8-10页
第二章文本分类概述	第10-26页
·文本预处理	第10-13页
·去除文档中的格式标记	第11页
·过滤非法字符和字母大小写转换	第11页
·去除停用词和稀有词	第11-12页
·词干化处理	第12页
·中文分词处理	第12-13页
·文本表示方法	第13-15页
·布尔权重	第14页
·词频权重	第14页
·tfidf权重	第14页
·tfc权重	第14-15页
·ltc权重	第15页
·维数约简	第15-18页
·文档频数	第16页
·信息增益	第16-17页
·互信息	第17-18页
·X~2统计量	第18页
·文本分类模型	第18-24页
·Rocchio分类器	第19页
·k近邻分类器	第19-20页
·支持向量机分类器	第20-22页
·其它常见分类模型	第22-24页
·评价方法	第24-26页
第三章相关理论和模型	第26-38页
·潜在语义索引模型	第26-30页
·模型原理	第26-28页
·潜在语义索引模型存在的问题	第28-30页
·偏最小二乘回归	第30-38页
·模型工作目标	第31页
·计算方法	第31-34页
·单因变量的简化算法	第34-35页
·有效性检测	第35-38页
第四章潜在语义分类模型	第38-46页
·问题的提出	第38-39页
·潜在语义分类模型	第39-46页
·模型原理	第39-41页
·数学推导	第41-42页
·LSC2算法	第42-44页
·LSC1算法	第44-46页
第五章实验结果和分析	第46-58页
·语料库	第46-48页
·Reuters-21578语料库	第46-47页
·复旦大学中文文本分类语料库	第47-48页
·语料库的比较分析	第48页
·数据预处理	第48-50页
·对Reuters-21578语料库的数据预处理	第49页
·对复旦大学中文文本分类语料库的数据预处理	第49-50页
·实验结果	第50-58页
·特征维数变化情况下的性能分析	第50-53页
·不同分类模型的性能比较	第53-58页
第六章总结与展望	第58-60页
·总结	第58-59页
·未来的工作	第59-60页
参考文献	第60-63页
致谢	第63-64页
个人简历	第64-65页
独创性声明	第65页
论文使用授权说明	第65页