首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于WAF的文档聚类技术研究

摘要第1-6页
ABSTRACT第6-10页
第一章 引言第10-14页
   ·课题研究背景第10-12页
   ·聚类研究现状第12页
   ·研究内容及安排第12-14页
第二章 文档聚类关键技术第14-26页
   ·文档表示模型第14-16页
     ·VSM模型第14-15页
     ·WAF模型第15-16页
   ·文档距离及相似度度量第16-17页
   ·聚类算法第17-20页
   ·聚类算法的评价准则第20-23页
     ·内部准则第20-21页
     ·外部准则第21-23页
   ·语料文档格式第23-26页
第三章 WAF物理意义分析与推导第26-34页
   ·WAF的几何意义第26页
   ·WAF的信息论意义第26-34页
     ·语言模型第27-29页
     ·信息熵第29-31页
     ·WAF与语言模型的关系及WAF的信息论意义第31-34页
第四章 对应用于文档模型的WAF的改进第34-40页
   ·WAF文档模型的相似度度量第34-35页
   ·WAF和A值的平滑方法第35-40页
     ·WAF平滑第35-38页
     ·A值平滑第38-40页
第五章 基于WAF的文档聚类的算法实现和实验分析第40-70页
   ·实验目的和方法第40页
   ·实验语料说明第40-41页
   ·实验步骤和关键实现第41-56页
     ·预处理第41-47页
     ·聚类第47-55页
     ·评价第55-56页
   ·实验结果和分析第56-68页
     ·K-means聚类的实验结果第57-60页
     ·HAC聚类的实验结果第60-68页
   ·实验结果总结第68-70页
第六章 海量短文本文档流聚类与存储第70-72页
   ·短文本文档聚类方法第70-71页
   ·聚类统计信息和文档存储系统第71-72页
第七章 总结与展望第72-73页
参考文献第73-75页
致谢第75-76页
攻读学位期间发表的学术论文目录第76页

论文共76页,点击 下载论文
上一篇:渠道集中系统易用性测试方案设计、执行和结果分析
下一篇:复杂背景下抗遮挡的车辆检测技术