首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于语义引力及密度分布的Web文本聚类算法的研究与实现

摘要第1-7页
Abstract第7-13页
第1章 绪论第13-21页
   ·问题提出第13-14页
   ·WEB文本挖掘存在的问题及本文研究内容第14-18页
     ·WEB文档获取存在的问题第14-15页
     ·文档聚类存在的问题第15-16页
     ·本文研究内容第16-18页
   ·本文结构第18-21页
第2章 相关理论研究第21-31页
   ·中文文本预处理第21-26页
     ·分词第21-22页
     ·向量空间模型第22-23页
     ·特征词选择及维度约减第23-24页
     ·基于PLSA的语义向量表示第24-26页
   ·相似度计算第26-27页
   ·文本聚类第27-29页
     ·文本聚类定义第27-28页
     ·文本聚类算法第28-29页
   ·本章小结第29-31页
第3章 WEB文档采集与处理技术第31-43页
   ·WEB文档抓取及其预处理第31-36页
     ·WEB文档的抓取第31-33页
     ·WEB文档的预处理第33-35页
     ·去除HTML标签第35页
     ·主体数据块识别第35-36页
   ·WEB文本解析相关技术及实现第36-41页
     ·网页内容解析第37-38页
     ·网页解析算法及实现第38-41页
   ·本章小结第41-43页
第4章 语义引力相似度计算模型第43-47页
   ·问题描述第43-44页
   ·语义引力相似度相关定义第44-45页
   ·基于语义引力的数据相似度计算方法第45-46页
   ·本章小结第46-47页
第5章 语义引力文本聚类算法第47-55页
   ·文本向量引力空间模型第47-48页
     ·空间模型的定义第47页
     ·空间模型的构建第47-48页
   ·语义引力聚类算法总体思想第48-51页
     ·文本向量引力密度分布第50-51页
     ·聚类过程参数设置及优化第51页
   ·文本聚类描述第51-54页
   ·本章小结第54-55页
第6章 实验结果分析第55-67页
   ·相似度计算方法的比较第55-56页
   ·聚类方法的比较第56-58页
   ·高维文本数据集实验分析第58-59页
     ·相似度计算方法的比较第58-59页
     ·聚类方法的比较第59页
   ·WEB文本聚类实验分析第59-62页
     ·语义引力相似度在WEB文本聚类的应用分析第59-61页
     ·WEB文本聚类实验分析第61-62页
   ·影响因素第62-65页
     ·实验语料第63页
     ·参数选择对聚类结果的影响第63页
     ·数据分布特点对聚类结果的影响第63-64页
     ·潜在语义对聚类结果的影响第64-65页
   ·本章小结第65-67页
第7章 结论第67-69页
   ·本文的主要贡献与结论第67-68页
   ·进一步的工作第68-69页
参考文献第69-73页
致谢第73-75页
攻硕期间参与项目及发表的论文第75页

论文共75页,点击 下载论文
上一篇:带钢表面缺陷图像中目标区域的分割研究
下一篇:脑血管可视化技术研究与实现