首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

小文本聚类技术及其在电子邮件中的应用研究

摘要第1-6页
Abstract第6-11页
第1章 绪论第11-15页
   ·研究背景第11-12页
   ·问题的提出第12页
   ·本文工作第12-13页
   ·组织结构第13-15页
第2章 相关工作第15-27页
   ·文本聚类技术第15-19页
     ·基于划分的聚类技术第15-17页
     ·基于层次的聚类技术第17-18页
     ·基于密度的聚类技术第18-19页
     ·基于网格的聚类技术第19页
   ·小文本聚类预处理技术第19-20页
     ·小文本标准化技术第20页
     ·小文本向量构造技术第20页
   ·小文本特征抽取技术第20-23页
     ·文本频率第21页
     ·互信息第21-22页
     ·CHI统计第22-23页
     ·词频-反文本频率第23页
   ·小文本聚类相关技术第23-24页
   ·小文本聚类效果评估第24-25页
   ·本章小结第25-27页
第3章 小文本标准化方法及问题定义第27-33页
   ·Email小文本特点分析第27-28页
   ·Email小文本标准化方法第28-29页
   ·Jaccard计算相似度第29-30页
   ·改进的EJaccard方法计算Email小文本相似度第30页
   ·TFIDF与Cosine结合计算相似度第30-32页
   ·问题定义第32页
   ·本章小结第32-33页
第4章 面向EMAIL小文本改进的层次聚类方法第33-41页
   ·基于Email小文本的层次聚类算法第33-34页
   ·基于Email小文本的改进的层次聚类算法第34-35页
   ·基于层次聚类的代表点选择第35-37页
   ·算法实现第37-40页
     ·基于最大相似度的MSA算法实现第37-38页
     ·URPA算法实现第38-40页
   ·本章小结第40-41页
第5章 面向EMAIL小文本的局部和全局聚类方法第41-53页
   ·Email小文本内容特征分析第41-42页
   ·面向Email小文本的局部聚类方法第42-46页
     ·基于Email单句内容的局部聚类第42-43页
     ·基于Email多句内容的局部聚类第43-44页
     ·基于Email小文本格式的局部聚类第44-46页
   ·基于Email小文本内容的全局聚类第46-50页
     ·基本思想第46页
     ·基于Email小文本的全局聚类算法第46-48页
     ·全局聚类GCE算法分析第48-49页
     ·相似度阈值分析第49-50页
   ·基于Email主题的聚类第50-52页
     ·基于Email相似主题的小文本聚类第50-51页
     ·基于Email内容无关的小文本分离第51页
     ·时间间隔阂值分析第51-52页
   ·本章小结第52-53页
第6章 实验及分析第53-67页
   ·实验环境第53-54页
     ·测试平台第53页
     ·实验数据第53-54页
   ·全局相似度阈值测试第54-58页
     ·全局相似度在Email原始内容上的测试第54-56页
     ·全局相似度在特征词集上的测试第56-58页
   ·基于Email的GCE与CURE的对比测试第58-59页
   ·基于不同相似度的代表点聚类测试第59-60页
   ·基于单句内容SSLC的局部调和系数测试第60-61页
   ·基于多句内容MSLC的比例系数测试第61-63页
   ·局部聚类对比测试第63-64页
   ·时间间隔阈值测试第64-66页
   ·本章小结第66-67页
第7章 总结与展望第67-69页
参考文献第69-73页
致谢第73-75页
攻硕期间参加的项目和发表的论文第75页

论文共75页,点击 下载论文
上一篇:面向统计机器翻译的语料处理与评价技术研究
下一篇:三维模型构建与动态目标识别算法设计与实现