首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向短消息的文本聚类研究

摘要第1-6页
Abstract第6-11页
插图索引第11-12页
附表索引第12-13页
第1章 绪论第13-21页
   ·研究背景和意义第13-16页
   ·研究的主要问题和挑战第16-18页
   ·本文的研究内容第18-20页
   ·本文的组织结构第20-21页
第2章 文本模型及聚类方法分析第21-30页
   ·文本表示模型第21-23页
     ·布尔模型第21页
     ·向量空间模型第21-22页
     ·概率模型第22-23页
     ·其他模型第23页
   ·相似度计算方法第23-26页
     ·基于向量空间模型的 TF-IDF 方法第23-24页
     ·潜在语义标引法第24-25页
     ·基于汉明距离的文本相似度计算方法第25页
     ·基于语义理解的文本相似度计算方法第25-26页
   ·主要聚类算法第26-29页
     ·划分的方法第26-27页
     ·层次的方法第27页
     ·基于密度的方法第27页
     ·基于网格的方法第27-28页
     ·基于模型的方法第28页
     ·后缀树(STC)聚类算法第28-29页
   ·本章小结第29-30页
第3章 短消息会话场景聚类系统设计第30-37页
   ·常规文本聚类过程第30-31页
   ·短消息文本特性分析第31-33页
     ·会话交错性特征第31页
     ·文本稀疏性特征第31-33页
     ·大规模特征第33页
   ·短消息聚类系统设计第33-34页
   ·会话抽取技术第34-36页
   ·本章小结第36-37页
第4章 短文本相似度计算第37-45页
   ·相关问题及技术分析第37-39页
     ·相关问题第37页
     ·相关技术第37-39页
   ·基于词法分类器度量词间关系第39-42页
     ·《知网》简介第39-40页
     ·义原相似度计算第40-41页
     ·概念相似度计算第41-42页
     ·词语相似度计算第42页
   ·短文本相似性度量算法第42-43页
   ·实验第43-44页
   ·本章小结及改进设想第44-45页
第5章 短文本聚类算法 SMHC第45-56页
   ·基于频繁词集的聚类算法第45-46页
   ·Ant-Tree 算法第46-49页
   ·基于频繁词集和 Ant-Tree 的混合聚类算法第49-53页
     ·构建初始聚簇第49-51页
     ·轮廓系数第51-52页
     ·SMHC 算法第52-53页
   ·实验第53-55页
     ·实验设置第53页
     ·评价指标第53-54页
     ·实验结果及分析第54-55页
   ·本章小结第55-56页
第6章 短消息文本聚类系统应用设计第56-61页
   ·系统结构第56-57页
   ·各功能单元结构分析第57-60页
     ·数据访问单元第57-58页
     ·文本预处理单元第58页
     ·相似性度量单元第58页
     ·会话合成单元第58-59页
     ·聚类单元第59页
     ·检索单元第59-60页
   ·本章小结第60-61页
总结第61-63页
参考文献第63-67页
附录 A 攻读硕士学位期间所发表的学术论文第67-68页
致谢第68页

论文共68页,点击 下载论文
上一篇:湖南省兵器工业集团有限责任公司发展战略研究
下一篇:基于三层架构体系的软件容错技术研究