首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

搜索引擎返回结果聚类技术的研究与实现

摘要第1-8页
Abstract第8-12页
第1章 绪论第12-16页
   ·课题研究的背景及意义第12-13页
   ·国内外研究现状第13-14页
   ·本文的工作与安排第14-16页
第2章 搜索引擎结果聚类概述第16-25页
   ·搜索引擎结果聚类的定义和优势第16页
   ·搜索引擎结果聚类的过程第16-17页
   ·搜索结果聚类的关键技术第17-24页
     ·获取搜索引擎返回的结果第17页
     ·文本预处理第17-18页
     ·文本表示模型第18-19页
     ·文本聚类算法第19-21页
     ·性能评价第21-24页
   ·本章小结第24-25页
第3章 特征提取与文本权重的分析第25-32页
   ·特征提取第25-26页
   ·TF-IDF文本权重的分析第26-31页
     ·TF-IDF权重计算法第26-27页
     ·TF-IDF的整合思想第27-31页
   ·本章小结第31-32页
第4章 Lingo聚类算法分析及改进策略第32-45页
   ·文本聚类在搜索引擎中的应用特点第32页
   ·Lingo聚类算法的介绍第32-38页
     ·Lingo算法分析第33-34页
     ·实验与比较第34-38页
   ·Lingo聚类算法的改进第38-44页
     ·问题的提出第38页
     ·Lingo权重的改进第38页
     ·Lingo聚类结果的层次化组织第38-40页
     ·类标签合并策略的改进第40-43页
     ·算法改进中遇到的问题及解决方案第43-44页
   ·本章小结第44-45页
第5章 HappyDonkey聚类系统的设计与实现第45-61页
   ·HappyDonkey聚类系统的分类模块介绍第45页
   ·获取搜索结果第45-51页
     ·Nutch搜索引擎的介绍第45-46页
     ·安装和配置Nutch第46-48页
     ·获取搜索结果第48-51页
   ·预处理模块第51-52页
   ·词性标注第52-57页
     ·对数线性词性标注器第52-55页
     ·基于 XML的词性词典的设计与实现第55-57页
   ·特征提取第57页
   ·聚类模块第57页
   ·查询接口的设计与实现第57-59页
   ·运行效果第59-60页
   ·本章小结第60-61页
第6章 实验结果与分析第61-68页
   ·测试环境说明第61页
   ·测试实验设置和结果第61-67页
   ·本章小结第67-68页
总结与展望第68-70页
致谢第70-71页
参考文献第71-76页
攻读硕士学位期间的发表的论文第76页

论文共76页,点击 下载论文
上一篇:Web挖掘相关问题的研究
下一篇:基于ORACLE的数据库性能调优技术研究