首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于LDA的潜在语义空间分析及Web文档聚类的研究与实现

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-14页
   ·研究背景和意义第10-11页
   ·本文的研究工作第11-12页
     ·研究目的第11页
     ·主要研究工作第11-12页
   ·本文内容和结构安排第12-14页
第2章 研究基础第14-22页
   ·文档预处理第14页
     ·中文分词第14页
     ·去除停用词第14页
   ·文档特征选择第14-15页
   ·文档表示第15-17页
     ·向量空间模型第15-16页
     ·潜在语义分析模型第16-17页
   ·文档聚类第17-20页
     ·文档聚类概述第17页
     ·文本相似性计算第17-18页
     ·常用的文档聚类方法第18-19页
     ·游离点检测第19-20页
   ·本章小结第20-22页
第3章 基于LDA的语义空间分析第22-34页
   ·LDA模型描述第22-23页
   ·LDA模型进一步分析第23-25页
     ·Dirichlet分布第23-24页
     ·LDA模型中参数的意义第24-25页
   ·基于语义的文档特征表示第25-28页
     ·语义的表现形式第25-26页
     ·语义的特征和权重第26-28页
     ·文档的表现形式第28页
   ·基于α的语义空间分析第28-32页
   ·本章小结第32-34页
第4章 基于LDA语义区间分析的游离点检测第34-40页
   ·游离点分析第34页
   ·游离点定位算法第34-36页
   ·实验第36-38页
   ·本章小结第38-40页
第5章 基于文档类别与语义的互作用机制的聚类第40-50页
   ·基于LDA的文档聚类算法总体结构第40-41页
   ·K-means算法第41-42页
   ·特征平滑第42-46页
   ·聚类结果修正第46-49页
   ·本章小结第49-50页
第6章 实验与结果分析第50-58页
   ·数据集及评价标准第50页
   ·对γ矩阵不同预处理方法的聚类实验第50-52页
   ·基于“类别与语义互作用”机制的聚类结果修正实验第52-53页
   ·基于PLSA的聚类结果对比与分析第53-55页
   ·更严格的文档集上的实验第55-57页
     ·初始K-means聚类结果对比实验第55-56页
     ·基于“类别与语义互作用”机制的聚类结果修正实验第56-57页
   ·本章小结第57-58页
第7章 结论第58-60页
   ·本文主要工作第58-59页
   ·工作中的不足第59-60页
参考文献第60-62页
致谢第62-64页
攻硕期间参与项目及发表的论文第64页

论文共64页,点击 下载论文
上一篇:基于图像处理的二维QR Code条码译码系统研究
下一篇:基于顺序度量特征的视频拷贝检测系统的研究与实现