一种面向标签质量的检索结果聚类方法

摘要	第1-6页
ABSTRACT	第6-9页
第一章绪论	第9-16页
·研究背景与意义	第9-10页
·检索结果聚类的研究现状	第10-14页
·聚类技术的发展	第10-12页
·聚类搜索引擎的发展	第12-14页
·本文的主要工作	第14页
·本论文组织结构	第14-16页
第二章相关理论知识和技术研究	第16-33页
·基本知识	第16-20页
·一般数值聚类算法	第16-17页
·检索结果聚类模型	第17-20页
·评估方法	第20页
·检索结果聚类的方法划分	第20-26页
·居于文档相似度的聚类	第20-21页
·基于词组划分的聚类	第21-22页
·基于短语抽取的聚类	第22-25页
·基于的日志的聚类	第25-26页
·典型的检索结果聚类算法	第26-31页
·后缀树聚类方法(STC)	第26-28页
·语义在线层次聚类（SHOC）	第28-30页
·Lingo 聚类算法	第30-31页
·本章小结	第31-33页
第三章检索聚类算法的设计	第33-44页
·研究目标	第33页
·算法模块设计	第33-35页
·关键问题和解决	第35-41页
·主干词的打分	第35-36页
·查询的分解与合并	第36页
·短语频率的计算	第36-37页
·短语的完整性度量	第37-38页
·标签的评分和排序	第38-39页
·文档的划分	第39-41页
·实现流程	第41-42页
·本章小结	第42-44页
第四章检索聚类算法的实现方法	第44-54页
·候选词评分	第44-46页
·到候选词的平均距离	第44-45页
·包含候选词的文档的平均相似度	第45页
·候选词的得分	第45-46页
·查询的分解与合并	第46-47页
·短语的获取与频率的计算	第47-48页
·词序列评分	第48-50页
·计算词序列的右独立性	第48-49页
·计算词序列的左独立性	第49-50页
·计算词序列的独立性分数	第50页
·对标签的评分和排序	第50页
·文档的划分	第50-53页
·本章小结	第53-54页
第五章实验设计与结果分析	第54-62页
·实验目的	第54页
·实验数据与实验设计	第54页
·实验结果及分析	第54-61页
·近似短语相似度计算的引进对短语频率计算的作用	第54-56页
·短语的特征评估与评分模型的选取	第56-57页
·剩余文档的划分	第57-58页
·和Lingo 方法比较	第58-61页
·本章小结	第61-62页
结论	第62-64页
参考文献	第64-69页
攻读硕士学位期间取得的研究成果	第69-70页
致谢	第70页