首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

垂直搜索引擎中数据清洗及排序算法的研究与实现

摘要第4-5页
ABSTRACT第5页
第一章 绪论第9-13页
    1.1 课题背景与意义第9-10页
    1.2 国内外研究现状第10-12页
        1.2.1 垂直搜索研究现状第10页
        1.2.2 数据清洗研究现状第10-11页
        1.2.3 搜索引擎排序算法的研究现状第11-12页
    1.3 课题主要内容第12页
    1.4 论文组织结构第12-13页
第二章 相关技术分析第13-25页
    2.1 搜索引擎第13-15页
        2.1.1 搜索引擎原理第13-14页
        2.1.2 垂直搜索引擎第14-15页
        2.1.3 搜索引擎评价指标第15页
    2.2 LUCENE/SOLR第15-19页
        2.2.1 Lucene整体架构第15-17页
        2.2.2 Lucene索引机制第17-19页
    2.3 机器学习第19-20页
        2.3.1 机器学习的定义第19页
        2.3.2 机器学习的分类第19-20页
    2.4 个性化推荐第20-24页
        2.4.1 推荐系统架构分析第20-21页
        2.4.2 推荐算法分析第21-24页
    2.5 本章小结第24-25页
第三章 垂直搜索中的数据清洗第25-41页
    3.1 互联网中的数据状况第25-27页
    3.2 数据清洗框架设计第27-30页
    3.3 记录关联第30-38页
        3.3.1 记录关联问题第30-31页
        3.3.2 记录关联中分块问题的一般方法第31-33页
        3.3.3 基于Lucene的分块方法第33-34页
        3.3.4 记录关联实验第34-38页
    3.4 清洗数据第38-40页
        3.4.1 最大概率法第38-39页
        3.4.2 滑动窗口法第39页
        3.4.3 最大先验概率法第39-40页
    3.5 本章小结第40-41页
第四章 垂直搜索中的排序算法第41-57页
    4.1 排序问题描述第41-42页
    4.2 对象级别的排序方法第42-43页
    4.3 Lucene的排序算法第43-44页
    4.4 个性化排序第44-51页
        4.4.1 个性化推荐与个性化排序第44-45页
        4.4.2 基于内容的个性化排序算法第45-46页
        4.4.3 基于隐语义模型的个性化排序第46-51页
    4.5 个性化排序实验第51-56页
        4.5.1 评价指标第51-52页
        4.5.2 数据集第52-53页
        4.5.3 实验结果及分析第53-56页
    4.6 本章小结第56-57页
第五章 系统实现及实验验证第57-79页
    5.1 总体设计第57-58页
    5.2 数据存储第58-59页
    5.3 数据清洗过程第59-64页
        5.3.1 标准化模块设计第59-61页
        5.3.2 聚合模块设计第61-62页
        5.3.3 清洗模块设计第62-63页
        5.3.4 人工校正第63-64页
    5.4 索引与搜索服务器第64-68页
        5.4.1 安装Solr第64-65页
        5.4.2 优化索引方式第65-66页
        5.4.3 搜索及基本排序算法第66-68页
    5.5 个性化排序模块第68-74页
        5.5.1 个性化模型的建立与更新第68-71页
        5.5.2 基于Solr的个性化排序第71-74页
    5.6 系统测试第74-78页
        5.6.1 总体测试第74-75页
        5.6.2 数据质量测试第75-76页
        5.6.3 个性化排序测试第76-77页
        5.6.4 性能测试第77-78页
    5.7 本章小结第78-79页
第六章 总结与展望第79-80页
    6.1 全文总结第79页
    6.2 工作展望第79-80页
参考文献第80-84页
致谢第84-85页
攻读学位期间发表的学术论文和科研情况第85页

论文共85页,点击 下载论文
上一篇:融合网络下M2M平台的设计与实现
下一篇:基于Web挖掘的个性化推荐系统的设计与实现