首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

微博检索结果优化研究

摘要第4-5页
ABSTRACT第5页
第一章 绪论第9-13页
    1.1 课题研究背景第9-10页
    1.2 本文研究内容和意义第10-11页
    1.3 论文结构第11-13页
第二章 文本检索相关技术第13-21页
    2.1 信息检索技术概况第13-14页
    2.2 常见的文本检索模型第14-16页
        2.2.1 布尔模型第14页
        2.2.2 向量空间模型第14页
        2.2.3 概率检索模型第14-15页
        2.2.4 语言模型第15页
        2.2.5 Learning to rank( LTR)模型第15页
        2.2.6 几种排序模型的比较第15-16页
    2.3 Learning to rank排序模型第16-18页
        2.3.1 Pointwise第16-17页
        2.3.2 Pairwise第17页
        2.3.3 Listwise第17-18页
    2.4 信息检索系统衡量标准第18-19页
        2.4.1 P@k第18页
        2.4.2 MAP (Mean Average Precision)第18页
        2.4.3 NDCG(Normalized Discounted Cumulative Gain)第18-19页
    2.5 微博检索的研究现状第19-20页
    2.6 总结第20-21页
第三章 基于相关性提升的微博检索结果排序优化第21-37页
    3.1 实验数据的采集与预处理第21-24页
        3.1.1 微博语料的特点第21-22页
        3.1.2 数据预处理第22-24页
    3.2 特征选择第24-26页
        3.2.1 神经网络及Word2vec工具介绍第24-25页
        3.2.2 语义特征第25-26页
        3.2.3 推特结构特征第26页
    3.3 Learning to rank(LTR)模型对排序结果的影响第26-30页
        3.3.1 LTR模型的三种结构比较第26-27页
        3.3.2 决策树模型的组合GBDT模型第27-28页
        3.3.3 LTR与GBDT模型的结合第28-29页
        3.3.4 RankNet、LambdaRank、LambdaMART与本文使用的网络结构比较第29-30页
    3.4 实验结果的展示与分析第30-33页
        3.4.1 评价结果的指标第30-31页
        3.4.2 特征的有效性第31-32页
        3.4.3 模型结构的有效性第32-33页
    3.5 排序模型分话题效果及badcase分析第33-36页
    3.6 总结第36-37页
第四章 基于多样性的微博检索结果排序优化第37-47页
    4.1 聚类方法优化多样性排序第37-41页
        4.1.1 K-means聚类第37页
        4.1.2 句向量的表示方法研究第37-39页
        4.1.3 句向量与聚类结合优化多样性排序第39-41页
    4.2 去重算法优化多样性排序第41-43页
        4.2.1 Simhash去重算法研究第41-42页
        4.2.2 多样性优化实验效果及分析第42-43页
    4.3 去重与聚类方法的对比分析第43-44页
    4.4 总结第44-47页
第五章 TREC微博检索评测流程设计第47-57页
    5.1 系统概述第47-48页
    5.2 预处理模块第48页
    5.3 索引模块第48-50页
        5.3.1 Lucene检索模型第48-50页
        5.3.2 Indri检索模型第50页
    5.4 查询扩展模块第50-52页
        5.4.1 TF~*IDF算法第50-51页
        5.4.2 词激活力算法(WAF)第51-52页
    5.5 结果重排序模块第52-54页
        5.5.1 高频词比例打分第52页
        5.5.2 亲密词比例打分第52页
        5.5.3 重要序列模式打分第52-53页
        5.5.4 外部语料打分第53页
        5.5.5 多元线性回归模型进行重排序第53-54页
    5.6 评测结果分析第54页
    5.7 总结第54-57页
第六章 总结与展望第57-59页
参考文献第59-63页
致谢第63页

论文共63页,点击 下载论文
上一篇:多层次图像检索
下一篇:覆盖测试中循环结构的路径选择方法研究与实现