多语言文本聚类研究

摘要	第1-6页
ABSTRACT	第6-10页
第1章绪论	第10-13页
·研究背景	第10页
·多语言文本聚类研究现状	第10-11页
·本文的研究意义和目的	第11-12页
·本文的研究思路和主要工作	第12页
·本文的组织结构	第12-13页
第2章文本聚类概述	第13-24页
·文本聚类简介	第13页
·文本聚类的一般过程	第13-14页
·特征表示和相似度计算	第14-17页
·向量空间模型(VSM)	第14-16页
·文档相似度计算	第16-17页
·特征降维	第17-19页
·文本聚类方法	第19-21页
·基于划分的聚类算法	第20页
·基于层次的聚类算法	第20-21页
·基于密度的聚类算法	第21页
·基于模型的聚类算法	第21页
·基于网格的聚类算法	第21页
·聚类效果评价方法	第21-23页
·F值	第21-22页
·熵值(Entropy)	第22-23页
·本章小结	第23-24页
第3章多语言文本聚类	第24-33页
·多语言文本聚类的基本思想	第24页
·多语言文本表示	第24-28页
·映射到单语言空间	第25-26页
·映射到多语言空间	第26-28页
·隐含语义标引模型	第28-32页
·LSI的数学基础	第28-30页
·LSI的基本原理	第30-32页
·本章小结	第32-33页
第4章中英双语新闻文本聚类实验	第33-45页
·中英双语新闻文本资源的获取	第33-35页
·基于翻译系统的中英双语新闻文本聚类实验	第35-39页
·预处理	第35-36页
·实验策略的设定	第36-37页
·实验结果分析和说明	第37-39页
·基于隐含语义标引的中英双语新闻文本聚类	第39-43页
·预处理	第39-41页
·实验策略的设定	第41页
·实验结果分析和说明	第41-43页
·本章小结	第43-45页
第5章结束语	第45-47页
·本文工作总结和不足	第45-46页
·下一步研究工作	第46-47页
附录Ⅰ 基于翻译系统的双语混合文本实验结果初始数据	第47-51页
附录Ⅱ 基于隐含语义分析的混合文本实验结果初始数据	第51-53页
参考文献	第53-56页
致谢	第56页