首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于潜在语义的中文文本聚类及其应用

摘要第1-7页
ABSTRACT第7-11页
第1章 引言第11-15页
   ·研究背景第11页
   ·研究目的第11-13页
   ·研究的意义第13页
   ·全文的组织结构第13-15页
第2章 相关工作第15-27页
   ·文本预处理第15-18页
     ·中文分词第15-17页
     ·降维技术第17页
     ·权重计算第17-18页
   ·文本聚类及其应用第18-21页
     ·文本聚类概述第18页
     ·文本聚类的应用第18-19页
     ·聚类算法第19-21页
   ·数据场在文本聚类中的应用第21-23页
     ·数据场概述第21-22页
     ·场强函数第22-23页
   ·云理论及其在文本聚类中的应用第23-26页
     ·文本数据的不确定性第23-25页
     ·云理论第25-26页
   ·本章小结第26-27页
第3章 基于潜在语义的中文文本聚类第27-43页
   ·潜在语义分析第27-32页
     ·截断奇异值分解第27-28页
     ·潜在语义空间更新方法第28-30页
     ·潜在语义应用示例及其解释第30-32页
     ·潜在语义分析的不足第32页
   ·弱势特征替换策略第32-41页
     ·基于《同义词林》的词义距离计算第33-34页
     ·基于《知网》的词义距离的计算第34-37页
     ·弱势特征替换的具体实现第37-41页
   ·基于潜在语义的多层次文本聚类第41页
   ·本章小结第41-43页
第4章 基于数据场改进的k-平均聚类算法第43-55页
   ·k-平均算法描述第43-44页
     ·欧氏距离和余弦距离第43页
     ·基于方差标准的准则函数第43-44页
     ·k-平均算法第44页
   ·基于数据场与云理论改进的k-平均算法第44-54页
     ·数据势分布函数第45-46页
     ·改进的数据势分布函数第46页
     ·数据对象间的影响因子第46-49页
     ·基于数据场的孤立点检测第49-50页
     ·基于数据场确定初始簇中心第50-51页
     ·基于云理论对孤立点分类第51-54页
   ·中文文本聚类过程第54页
   ·本章小结第54-55页
第5章 基于用户信息的文本聚类算法研究第55-61页
   ·基于用户的历史访问记录的多层次聚类算法第55-57页
   ·基于用户个人信息的多层次聚类第57-59页
     ·基于知网的个人信息扩展第57-59页
     ·基于用户个人信息的多层次聚类第59页
   ·本章小节第59-61页
第6章 实验结果与分析第61-67页
   ·评估标准第61-62页
   ·改进k-平均算法实验结果第62-64页
   ·基于用户信息的文本聚类算法的实验结果第64-65页
   ·本章小结第65-67页
第7章 结束语第67-69页
   ·本文总结第67页
   ·工作展望第67-69页
参考文献第69-73页
致谢第73-75页
攻硕期间参加的项目及发表的论文第75页

论文共75页,点击 下载论文
上一篇:本地搜索领域POI缩略词词典的研究
下一篇:基于统一映射规则的数据转换方法的研究与应用