首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于《知网》的文本聚类研究

摘要第1-5页
ABSTRACT第5-8页
第一章 绪论第8-12页
 §1-1 研究背景和意义第8-9页
 §1-2 文本聚类的研究现状和存在的问题第9-10页
  1-2-1 文本聚类的研究现状第9-10页
  1-2-2 文本聚类中存在的问题第10页
 §1-3 本文的研究内容第10-11页
 §1-4 论文组织第11-12页
第二章 文本聚类概述第12-24页
 §2-1 分词第12-13页
 §2-2 依存分析第13-14页
 §2-3 去停用词第14页
 §2-4 向量空间模型第14-15页
 §2-5 降维方法第15-17页
 §2-6 聚类算法第17-19页
  2-6-1 划分算法第17-18页
  2-6-2 层次算法第18-19页
  2-6-3 概率聚类算法第19页
 §2-7 工具介绍第19-23页
  2-7-1 语言技术平台第19-21页
  2-7-2 知网第21-23页
 §2-8 本章小结第23-24页
第三章 基于《知网》的文本相似度计算第24-31页
 §3-1 基于 VSM 的 TF-IDF 文本相似度计算方法第24页
 §3-2 基于《知网》的文本相似度计算方法第24-29页
  3-2-1 构建低维的向量空间第25-26页
  3-2-2 新方法构造的向量空间是内积空间第26-27页
  3-2-3 向量空间中夹角的意义第27-28页
  3-2-4 相似度计算中加入词语的位置信息第28-29页
 §3-3 实验结果与分析第29-30页
 §3-4 本章小结第30-31页
第四章 基于《知网》的 K-Means 文本聚类算法实现第31-40页
 §4-1 K-Means 算法第31-32页
  4-1-1 K-Means 算法的思想和流程第31页
  4-1-2 K-Means 算法改进第31-32页
 §4-2 算法的实现第32-37页
  4-2-1 预处理模块第33页
  4-2-2 义原相似度模块第33-34页
  4-2-3 词语相似度模块第34-35页
  4-2-4 文章相似度模块第35-36页
  4-2-5 聚类算法模块第36-37页
 §4-3 实验结果第37-39页
  4-3-1 文本数据集第37页
  4-3-2 聚类算法的实验结果与分析第37-39页
 §4-4 结果分析第39页
 §4-5 本章小结第39-40页
第五章 总结与展望第40-41页
 §5-1 总结第40页
 §5-2 展望第40-41页
参考文献第41-44页
致谢第44页

论文共44页,点击 下载论文
上一篇:网络商品信息搜索与抽取技术应用研究
下一篇:河北省各地区产业结构和布局研究--基于发展低碳经济视角研究产业结构和布局调整