跨语言文本分类的研究

摘要	第1-6页
ABSTRACT	第6-10页
第1章绪论	第10-12页
·研究背景与意义	第10页
·跨语言文本分类	第10-11页
·研究现状	第11页
·本文组织	第11-12页
第2章相关工作和本文的研究思路	第12-24页
·文本分类概述	第12-18页
·文本分类的一般定义	第12页
·文本预处理	第12-13页
·文本的表示	第13-14页
·特征空间降维	第14-16页
·特征权重计算	第16-17页
·分类器	第17页
·测试与性能评价	第17-18页
·跨语言文本分类主要方法概述	第18-22页
·基于翻译的方法	第18-19页
·基于多语言模型的方法	第19页
·基于语言知识库的方法	第19-20页
·利用目标语言未标注文本提升 CLTC 效果	第20-21页
·其他方法	第21-22页
·对现有方法的分析	第22页
·本文研究思路的提出	第22-24页
第3章跨语言 K 近邻文本分类算法	第24-32页
·K 近邻算法	第24-25页
·跨语言 K 近邻文本分类算法	第25-32页
·文本表示	第25-28页
·跨语言相似度计算方法	第28-30页
·类别判定	第30-31页
·算法流程	第31-32页
第4章基于双视图主动学习的跨语言文本分类算法	第32-48页
·问题分析	第32-33页
·主动学习框架	第33-35页
·基于 SVM 的算法实现	第35-39页
·SVM 分类算法	第35-37页
·SVM 得到概率输出	第37-38页
·分类确定度的计算	第38-39页
·算法流程	第39页
·双视图主动学习算法	第39-48页
·跨语言分类问题的两种视图	第40-41页
·双视图主动学习框架	第41-44页
·算法流程	第44-48页
第5章实验与分析	第48-60页
·数据集	第48-49页
·语料库建设	第48页
·文本预处理	第48-49页
·跨语言 K 近邻文本分类算法	第49-53页
·实验准备	第49-50页
·CLKNN 实验	第50-52页
·与 Baseline 的对比	第52-53页
·总结	第53页
·基于双视图主动学习的跨语言文本分类算法	第53-60页
·实验准备	第54页
·单视图主动学习实验	第54-55页
·双视图主动学习实验	第55-57页
·与Baseline 的对比	第57-59页
·总结	第59-60页
结论	第60-62页
参考文献	第62-66页
攻读学位期间发表论文与研究成果清单	第66-67页
致谢	第67页