首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

潜在语义分类模型的研究

摘要第1-3页
ABSTRACT第3-4页
目录第4-6页
第一章 引言第6-10页
   ·研究背景第6-7页
   ·本文工作第7-8页
   ·论文组织第8-10页
第二章 文本分类概述第10-26页
   ·文本预处理第10-13页
     ·去除文档中的格式标记第11页
     ·过滤非法字符和字母大小写转换第11页
     ·去除停用词和稀有词第11-12页
     ·词干化处理第12页
     ·中文分词处理第12-13页
   ·文本表示方法第13-15页
     ·布尔权重第14页
     ·词频权重第14页
     ·tfidf权重第14页
     ·tfc权重第14-15页
     ·ltc权重第15页
   ·维数约简第15-18页
     ·文档频数第16页
     ·信息增益第16-17页
     ·互信息第17-18页
     ·X~2统计量第18页
   ·文本分类模型第18-24页
     ·Rocchio分类器第19页
     ·k近邻分类器第19-20页
     ·支持向量机分类器第20-22页
     ·其它常见分类模型第22-24页
   ·评价方法第24-26页
第三章 相关理论和模型第26-38页
   ·潜在语义索引模型第26-30页
     ·模型原理第26-28页
     ·潜在语义索引模型存在的问题第28-30页
   ·偏最小二乘回归第30-38页
     ·模型工作目标第31页
     ·计算方法第31-34页
     ·单因变量的简化算法第34-35页
     ·有效性检测第35-38页
第四章 潜在语义分类模型第38-46页
   ·问题的提出第38-39页
   ·潜在语义分类模型第39-46页
     ·模型原理第39-41页
     ·数学推导第41-42页
     ·LSC2算法第42-44页
     ·LSC1算法第44-46页
第五章 实验结果和分析第46-58页
   ·语料库第46-48页
     ·Reuters-21578语料库第46-47页
     ·复旦大学中文文本分类语料库第47-48页
     ·语料库的比较分析第48页
   ·数据预处理第48-50页
     ·对Reuters-21578语料库的数据预处理第49页
     ·对复旦大学中文文本分类语料库的数据预处理第49-50页
   ·实验结果第50-58页
     ·特征维数变化情况下的性能分析第50-53页
     ·不同分类模型的性能比较第53-58页
第六章 总结与展望第58-60页
   ·总结第58-59页
   ·未来的工作第59-60页
参考文献第60-63页
致谢第63-64页
个人简历第64-65页
独创性声明第65页
论文使用授权说明第65页

论文共65页,点击 下载论文
上一篇:当代中国乡镇行政体制改革研究
下一篇:人民币汇率决定因素及均衡与稳定研究