首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

Web中文文本聚类研究

摘要第1-6页
ABSTRACT第6-11页
第1章 绪论第11-17页
   ·引言.第11页
   ·Web 文本挖掘技术介绍第11-12页
   ·Web 文本聚类的研究意义第12-14页
   ·Web 中文文本聚类技术第14-15页
   ·本文工作及组织第15-17页
     ·本文工作第15页
     ·本文组织第15-17页
第2章 Web 文本聚类技术综述第17-28页
   ·文本表示模型第17-18页
     ·向量空间模型第17-18页
     ·后缀树文本模型第18页
   ·文本特征降维第18-20页
   ·文本相似度计算第20-22页
     ·文本对象之间的相似度第20-21页
     ·文本对象之间的相异度第21页
     ·文本集合与文本集合之间的邻近性度量第21-22页
   ·文本聚类算法第22-25页
     ·划分方法第22-23页
     ·层次方法第23-24页
     ·基于密度方法第24页
     ·基于网格方法第24-25页
     ·基于模型方法第25页
   ·语义相关问题第25-26页
   ·文本聚类效果的评价指标第26-27页
   ·本章小结第27-28页
第3章 基于MapReduce 的海量Web 中文文本聚类第28-43页
   ·MapReduce 相关技术介绍第28-33页
     ·背景第28-29页
     ·编程模式第29页
     ·实现框架第29-31页
     ·Hadoop 与MapReduce第31-33页
   ·基于MapReduce 的文本集合的tfidf 算法设计第33-35页
   ·基于MapReduce 的文本集合的canopy 聚类算法设计第35-36页
     ·Canopy 聚类第35-36页
     ·canopy 文本聚类算法在MapReduce 上的设计第36页
   ·基于MapReduce 的文本集合的K-means 聚类算法设计第36-38页
     ·K-means 聚类第36-37页
     ·K-means 文本聚类算法在MapReduce 上的设计第37-38页
   ·实验仿真第38-42页
     ·实验平台的搭建第38-39页
     ·实验数据第39页
     ·实验结果第39-42页
   ·本章小结第42-43页
第4章 基于后缀树的实时Web 文本聚类第43-54页
   ·后缀树数据结构第43-45页
     ·后缀树介绍第43-44页
     ·后缀树的构造第44-45页
   ·后缀树文本模型及其算法第45-47页
     ·中文特点第46页
     ·中文的后缀树文本模型及其算法第46-47页
   ·中文后缀树聚类算法STCC 的流程设计第47-50页
     ·文本预处理第47页
     ·利用后缀树提取文本特征第47-49页
     ·文本聚类第49-50页
   ·实验与分析第50-53页
     ·实验数据第51页
     ·实验结果与分析第51-53页
   ·本章小结第53-54页
第5章 总结与展望第54-56页
   ·总结第54页
   ·展望第54-56页
致谢第56-57页
参考文献第57-60页
附录第60页

论文共60页,点击 下载论文
上一篇:网格环境中数据传输服务的研究与应用
下一篇:交通视频中视点无关目标分类与检索方法研究