首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

垂直搜索中的数据清洗和排序算法研究

摘要第1-5页
ABSTRACT第5-9页
第1章 绪论第9-13页
   ·选题的背景和意义第9-10页
     ·选题的背景第9页
     ·选题的意义第9-10页
   ·国内外相关研究综述第10-11页
   ·本文研究的内容第11-12页
     ·数据清洗算法第11页
     ·查询结果排序算法第11-12页
   ·本文的组织第12-13页
第2章 相关背景技术第13-20页
   ·全文检索框架 Lucene 技术概述第13-14页
   ·搜索引擎的通用系统结构第14-15页
   ·排序模块的自适应第15-17页
     ·自适应系统的基本理论第15页
     ·系统原理图第15-16页
     ·反馈自适应搜索的系统结构第16-17页
   ·用户兴趣采集技术第17-19页
     ·浏览时间及点击次数转化为兴趣度的方法第18页
     ·对网页兴趣的计算第18-19页
   ·本章小结第19-20页
第3章 垂直搜索中的数据处理第20-33页
   ·重复数据的产生背景和消重的重要意义第20-21页
     ·重复数据的产生背景第20页
     ·数据消重的重要意义第20-21页
   ·数据消重的一般方法第21-24页
     ·基于网址的网页消重第21页
     ·基于聚类方法的网页消重第21页
     ·基于数字签名算法的数据消重第21-22页
     ·改进的基于MD5 数字签名的数据消重第22-24页
   ·实验结果及分析第24-25页
   ·不完整数据的处理第25-32页
     ·不完整数据处理方法步骤第25-26页
     ·缺失值补全规则第26页
     ·地址缺失值推测方法第26-27页
       ·正则表达式第26-27页
       ·推测方法第27页
     ·价格数据缺失值推测方法第27-32页
       ·ARIMA 模型的基本思想及数学模型第28页
       ·ARIMA 模型预测的基本程序第28-29页
       ·实验第29-32页
   ·本章小结第32-33页
第4章 搜索结果排序算法第33-43页
   ·Lucene 基础排序算法第33-36页
     ·Lucene 基础排序算法描述第33-35页
     ·Lucene 基础排序算法分析第35-36页
   ·PageRank 算法第36-40页
     ·PageRank 算法描述第36-39页
     ·PageRank 算法分析第39-40页
   ·基于 Lucene 基础排序算法的改进算法第40-41页
   ·实验结果及分析第41-42页
   ·本章小结第42-43页
第5章 系统设计与实现第43-57页
   ·平台概述第43页
   ·总体设计第43-44页
   ·核心模块设计第44-53页
     ·数据处理模块设计第44-49页
     ·索引建立及优化第49-51页
     ·搜索模块设计第51-53页
   ·系统测试第53-56页
   ·本章小结第56-57页
第6章 总结与展望第57-58页
   ·全文总结第57页
   ·本文主要贡献和创新点第57页
   ·进一步工作第57-58页
参考文献第58-61页
读硕士学位期间发表的论文和参加的项目第61-62页
致谢第62页

论文共62页,点击 下载论文
上一篇:人脸器官拼接融合及其在人脸动画中的应用
下一篇:无人车智能行为验证平台的虚拟交通场景研究