基于长尾查询需求理解的搜索引擎性能改进

摘要	第3-4页
Abstract	第4页
主要符号对照表	第8-9页
第1章引言	第9-15页
1.1 研究背景及意义	第9-10页
1.2 相关工作	第10-13页
1.2.1 长尾查询研究现状	第10-11页
1.2.2 查询改写策略研究	第11-12页
1.2.3 查询结果满意度评价研究	第12页
1.2.4 多结果列表合并研究	第12-13页
1.3 本文主要工作	第13-15页
第2章查询行为分析与预测	第15-30页
2.1 本章引论	第15页
2.2 用户查询行为分析	第15-23页
2.2.1 用户查询会话分析	第15-20页
2.2.1.1 数据说明	第15-16页
2.2.1.2 查询会话长度分析	第16-17页
2.2.1.3 查询词长度变化分析	第17-18页
2.2.1.4 结果点击分析	第18-19页
2.2.1.5 查询词频度变化分析	第19-20页
2.2.2 用户查询改写分析	第20-23页
2.2.2.1 查询改写程度分析	第20-21页
2.2.2.2 查询改写动作分析	第21-22页
2.2.2.3 查询改写与SERP的关系	第22-23页
2.3 用户查询行为分类与预测	第23-29页
2.3.1 查询改写行为预测	第24-26页
2.3.2 实验结果	第26-28页
2.3.3 分析与讨论	第28-29页
2.3.3.1 查询消耗时间分析	第28页
2.3.3.2 改写动作与查询频度的关系	第28-29页
2.4 本章小结	第29-30页
第3章长尾查询结果相关度自动评价	第30-36页
3.1 本章引论	第30页
3.2 数据集	第30页
3.3 长尾查询评价方法	第30-34页
3.3.1 特征提取	第31-33页
3.3.1.1 点击特征	第31页
3.3.1.2 标红特征	第31-33页
3.3.1.3 排序特征	第33页
3.3.2 数据不平衡处理	第33-34页
3.3.3 算法描述	第34页
3.4 实验结果与分析	第34-35页
3.5 本章小结	第35-36页
第4章长尾查询的结果优化	第36-52页
4.1 本章引论	第36页
4.2 结果融合系统框架	第36-37页
4.3 候选查询的生成	第37-38页
4.4 融合模型	第38-51页
4.4.1 概述	第38页
4.4.2 特征描述	第38-43页
4.4.2.1 结果文档匹配特征	第39-40页
4.4.2.2 查询相似度特征	第40-41页
4.4.2.3 查询满意度特征	第41-42页
4.4.2.4 满意度可改善情况特征	第42-43页
4.4.2.5 文档原始位置特征	第43页
4.4.3 算法描述	第43-44页
4.4.4 实验结果	第44-46页
4.4.4.1 实验数据与设置	第44-45页
4.4.4.2 对比基线	第45-46页
4.4.4.3 实验效果	第46页
4.4.5 实验结果分析	第46-51页
4.4.5.1 检索结果性能提升分析	第47-48页
4.4.5.2 引入不同数量文档	第48页
4.4.5.3 特征贡献分析	第48-50页
4.4.5.4 不同频度查询的效果对比	第50-51页
4.5 本章小结	第51-52页
第5章长尾查询性能改进系统	第52-55页
5.1 本章引论	第52页
5.2 系统框架	第52-53页
5.3 实验与结果	第53-54页
5.3.1 数据	第53-54页
5.3.2 实验结果	第54页
5.3.2.1 结果分析	第54页
5.4 本章小结	第54-55页
第6章总结与展望	第55-57页
6.1 工作总结	第55-56页
6.2 工作展望	第56-57页
参考文献	第57-61页
致谢	第61-63页
个人简历、在学期间发表的学术论文与研究成果	第63页