首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

一种基于查询日志的用户意图分析方法

摘要第5-6页
Abstract第6页
第1章 绪论第9-17页
    1.1 课题的研究背景及意义第9-11页
        1.1.1 课题的背景第9-10页
        1.1.2 课题的意义第10-11页
    1.2 国内外研究现状第11-14页
        1.2.1 国外研究现状第11-13页
        1.2.2 国内研究现状第13-14页
    1.3 主要研究内容和预期研究成果第14页
    1.4 本文的组织结构第14-17页
第2章 查询意图分类相关理论第17-29页
    2.1 查询意图概念界定和定义第17页
    2.2 Broder的查询意图分类体系及发展第17-19页
    2.3 已提出的用于分类的特征第19-24页
        2.3.1 N Clicks Satisfied第20-21页
        2.3.2 Top n Results Satisfied第21-22页
        2.3.3 平均编辑距离第22页
        2.3.4 点击链接的PageRank第22-23页
        2.3.5 点击熵和域名点击熵第23-24页
    2.4 用于查询意图分类的方法第24-27页
        2.4.1 决策树分类第24-26页
        2.4.2 贝叶斯分类第26页
        2.4.3 支持向量机第26-27页
    2.5 本章小结第27-29页
第3章 查询日志的处理与分析第29-41页
    3.1 查询日志第29-30页
        3.1.1 搜索日志的类型第29页
        3.1.2 本文用到的查询日志简介第29-30页
    3.2 基于噪声消除的日志预处理第30-31页
    3.3 基于时间间隔的session识别第31-34页
    3.4 查询日志的统计结果分析第34-36页
        3.4.1 查询长度分析第34页
        3.4.2 查询频度第34-35页
        3.4.3 Session相关分析第35-36页
    3.5 训练集和测试集的生成第36-39页
        3.5.1 基于泊松抽样的样本查询抽取第36-38页
        3.5.2 人工标注第38-39页
    3.6 本章小结第39-41页
第4章 基于改进ID3的查询意图分类算法第41-51页
    4.1 决策树分类第41-42页
    4.2 ID3算法的基本原理和存在的问题第42-46页
        4.2.1 基本概念第43页
        4.2.2 ID3算法的核心思想第43-45页
        4.2.3 ID3算法的优点和存在的问题第45-46页
    4.3 ID3算法的改进与优化方案第46-48页
    4.4 本文改进的ID3算法描述第48-49页
    4.5 本章小结第49-51页
第5章 实验及结果分析第51-59页
    5.1 实验平台及环境第51页
    5.2 使用UCI数据集验证改进的算法第51-53页
        5.2.1 UCI数据集简介第51页
        5.2.2 实验一:利用UCI数据集验证改进的ID3算法第51-53页
    5.3 改进ID3算法在用户查询意图分类上的应用第53-56页
        5.3.1 实验二:预备实验第54-55页
        5.3.2 实验三:查询意图分类第55-56页
    5.4 分类模型的性能评价第56-58页
    5.5 本章小结第58-59页
结论第59-61页
参考文献第61-67页
攻读硕士学位期间发表的论文和取得的科研成果第67-69页
致谢第69页

论文共69页,点击 下载论文
上一篇:基于时—空—内容特征的PTZ相机监控视频数据组织与检索
下一篇:网络热点话题检测技术研究