首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

多语言文本聚类研究

摘要第1-6页
ABSTRACT第6-10页
第1章 绪论第10-13页
   ·研究背景第10页
   ·多语言文本聚类研究现状第10-11页
   ·本文的研究意义和目的第11-12页
   ·本文的研究思路和主要工作第12页
   ·本文的组织结构第12-13页
第2章 文本聚类概述第13-24页
   ·文本聚类简介第13页
   ·文本聚类的一般过程第13-14页
   ·特征表示和相似度计算第14-17页
     ·向量空间模型(VSM)第14-16页
     ·文档相似度计算第16-17页
   ·特征降维第17-19页
   ·文本聚类方法第19-21页
     ·基于划分的聚类算法第20页
     ·基于层次的聚类算法第20-21页
     ·基于密度的聚类算法第21页
     ·基于模型的聚类算法第21页
     ·基于网格的聚类算法第21页
   ·聚类效果评价方法第21-23页
     ·F值第21-22页
     ·熵值(Entropy)第22-23页
   ·本章小结第23-24页
第3章 多语言文本聚类第24-33页
   ·多语言文本聚类的基本思想第24页
   ·多语言文本表示第24-28页
     ·映射到单语言空间第25-26页
     ·映射到多语言空间第26-28页
   ·隐含语义标引模型第28-32页
     ·LSI的数学基础第28-30页
     ·LSI的基本原理第30-32页
   ·本章小结第32-33页
第4章 中英双语新闻文本聚类实验第33-45页
   ·中英双语新闻文本资源的获取第33-35页
   ·基于翻译系统的中英双语新闻文本聚类实验第35-39页
     ·预处理第35-36页
     ·实验策略的设定第36-37页
     ·实验结果分析和说明第37-39页
   ·基于隐含语义标引的中英双语新闻文本聚类第39-43页
     ·预处理第39-41页
     ·实验策略的设定第41页
     ·实验结果分析和说明第41-43页
   ·本章小结第43-45页
第5章 结束语第45-47页
   ·本文工作总结和不足第45-46页
   ·下一步研究工作第46-47页
附录Ⅰ 基于翻译系统的双语混合文本实验结果初始数据第47-51页
附录Ⅱ 基于隐含语义分析的混合文本实验结果初始数据第51-53页
参考文献第53-56页
致谢第56页

论文共56页,点击 下载论文
上一篇:基于信息分类的网络书评多文档自动文摘研究
下一篇:宏观政策和信息冲击对中国股票、债券和黄金相关性影响的研究