搜索引擎返回结果聚类技术的研究与实现

摘要	第1-8页
Abstract	第8-12页
第1章绪论	第12-16页
·课题研究的背景及意义	第12-13页
·国内外研究现状	第13-14页
·本文的工作与安排	第14-16页
第2章搜索引擎结果聚类概述	第16-25页
·搜索引擎结果聚类的定义和优势	第16页
·搜索引擎结果聚类的过程	第16-17页
·搜索结果聚类的关键技术	第17-24页
·获取搜索引擎返回的结果	第17页
·文本预处理	第17-18页
·文本表示模型	第18-19页
·文本聚类算法	第19-21页
·性能评价	第21-24页
·本章小结	第24-25页
第3章特征提取与文本权重的分析	第25-32页
·特征提取	第25-26页
·TF-IDF文本权重的分析	第26-31页
·TF-IDF权重计算法	第26-27页
·TF-IDF的整合思想	第27-31页
·本章小结	第31-32页
第4章 Lingo聚类算法分析及改进策略	第32-45页
·文本聚类在搜索引擎中的应用特点	第32页
·Lingo聚类算法的介绍	第32-38页
·Lingo算法分析	第33-34页
·实验与比较	第34-38页
·Lingo聚类算法的改进	第38-44页
·问题的提出	第38页
·Lingo权重的改进	第38页
·Lingo聚类结果的层次化组织	第38-40页
·类标签合并策略的改进	第40-43页
·算法改进中遇到的问题及解决方案	第43-44页
·本章小结	第44-45页
第5章 HappyDonkey聚类系统的设计与实现	第45-61页
·HappyDonkey聚类系统的分类模块介绍	第45页
·获取搜索结果	第45-51页
·Nutch搜索引擎的介绍	第45-46页
·安装和配置Nutch	第46-48页
·获取搜索结果	第48-51页
·预处理模块	第51-52页
·词性标注	第52-57页
·对数线性词性标注器	第52-55页
·基于 XML的词性词典的设计与实现	第55-57页
·特征提取	第57页
·聚类模块	第57页
·查询接口的设计与实现	第57-59页
·运行效果	第59-60页
·本章小结	第60-61页
第6章实验结果与分析	第61-68页
·测试环境说明	第61页
·测试实验设置和结果	第61-67页
·本章小结	第67-68页
总结与展望	第68-70页
致谢	第70-71页
参考文献	第71-76页
攻读硕士学位期间的发表的论文	第76页