首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向短消息文本的聚类技术研究与应用

摘要第1-6页
ABSTRACT第6-11页
1. 绪论第11-16页
   ·课题研究背景第11-12页
   ·课题研究的目的和意义第12-13页
   ·短消息文本挖掘技术的现状与发展第13-15页
   ·研究内容及论文结构第15-16页
2. 短消息文本聚类技术概述第16-27页
   ·文本表示与计算第16-18页
     ·向量空间模型第17页
     ·后缀树模型第17-18页
   ·文本聚类算法第18-23页
     ·层次式聚类第18-19页
     ·划分式聚类第19-20页
     ·自组织映射第20-21页
     ·空间索引聚类第21-22页
     ·聚类算法比较第22-23页
   ·聚类有效性评价第23-26页
     ·熵第23-24页
     ·特征准量第24-25页
     ·平均准确率第25页
     ·时间复杂度第25-26页
   ·本章小结第26-27页
3. 短消息文本处理与特征提取第27-37页
   ·短消息文本来源第27-28页
   ·短消息文本特性第28-29页
   ·短消息文本预处理第29-31页
   ·基于分词的短消息文本处理与特征提取第31-34页
     ·中文分词处理第31-33页
     ·文本特征提取第33-34页
   ·基于后缀树模型的文本处理与特征提取第34-35页
     ·基于后缀树的特征提取第34-35页
     ·后缀树聚类的文本特征选择第35页
   ·本章小结第35-37页
4. 基于向量空间模型的短消息文本聚类第37-48页
   ·文本向量空间模型第37-41页
     ·特征项第37页
     ·特征项的权重第37-39页
     ·向量空间模型第39-40页
     ·文本相似度计算第40-41页
   ·向量空间模型短消息文本聚类第41-43页
     ·数据预处理第41-42页
     ·文本向量表示第42页
     ·传统聚类算法处理第42-43页
   ·实验仿真第43-47页
     ·实验数据第43-45页
     ·K-Means聚类结果第45-47页
   ·本章小结第47-48页
5. 基于后缀树的短消息文本聚类第48-61页
   ·后缀树相关概念第48-51页
   ·后缀树构建算法第51-52页
   ·后缀树聚类算法第52-54页
     ·文本预处理第52-53页
     ·短语基本类识别第53-54页
     ·短语类合并第54页
   ·实验仿真第54-57页
     ·实验数据及预处理第54-55页
     ·短语基本类识别第55-56页
     ·基本类合并及聚类结果第56-57页
   ·聚类算法比较第57-60页
     ·STC聚类结果第57-58页
     ·聚类结果比较第58-59页
     ·时间复杂度第59-60页
   ·本章小结第60-61页
6. 短消息文本聚类原型系统第61-69页
   ·系统开发平台与环境第61页
   ·系统总体结构第61-62页
   ·详细模块设计第62-66页
     ·短消息文本采集第62-63页
     ·文本预处理第63页
     ·聚类处理第63-64页
     ·聚类结果第64-66页
   ·系统运行效果第66-68页
   ·本章小结第68-69页
7. 总结与展望第69-72页
   ·总结第69-70页
   ·展望第70-72页
参考文献第72-77页
后记第77-78页
致谢第78页

论文共78页,点击 下载论文
上一篇:大额支付系统流动性需求及支付效率研究--基于优化的排队释放算法
下一篇:中国证券市场股票指数心理关口的实证研究