首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

短文本分类在搜索引擎中的研究与应用

摘要第4-5页
Abstract第5页
第一章 绪论第8-13页
    1.1 研究背景第8-9页
    1.2 国内外研究现状第9-10页
        1.2.1 国外研究现状第9-10页
        1.2.2 国内研究现状第10页
    1.3 研究目标与方法第10-11页
    1.4 研究内容与意义第11页
    1.5 论文的组织结构第11-13页
第二章 理论与技术基础第13-23页
    2.1 搜索引擎第13-14页
    2.2 文本分类技术第14-20页
        2.2.1 文本分类相关概念第14页
        2.2.2 文本分类过程第14-15页
        2.2.3 文本预处理第15-16页
        2.2.4 特征选择第16-17页
        2.2.5 特征加权第17-19页
        2.2.6 分类算法第19-20页
    2.3 短文本分类技术第20-23页
        2.3.1 短文本特点第20-21页
        2.3.2 短文本分类难点第21页
        2.3.3 短文本扩展方法第21-23页
第三章 基于伪相关反馈的短文本扩展方法第23-34页
    3.1 伪相关反馈技术第23页
    3.2 基于伪相关反馈的扩展方法第23-26页
        3.2.1 问题描述第23-25页
        3.2.2 结合排名因素计算特征权重第25页
        3.2.3 投票选择分类过程第25-26页
    3.3 搜索引擎中短文本扩展方法比较第26-27页
    3.4 实验与结果分析第27-34页
        3.4.1 实验环境第27页
        3.4.2 实验数据集第27-28页
        3.4.3 实验评估方法第28页
        3.4.4 实验评价指标第28-29页
        3.4.5 实验步骤第29-30页
        3.4.6 实验结果与分析第30-34页
第四章 基于分散度、集中度的文本特征加权算法第34-40页
    4.1 TF‐IDF算法存在的缺陷第34-35页
    4.2 基于分散度、集中度的改进TF‐IDF特征加权算法第35-37页
    4.3 实验与结果分析第37-40页
        4.3.1 实验步骤第37页
        4.3.2 实验结果与分析第37-40页
第五章 短文本分类在搜索引擎中的应用第40-51页
    5.1 概述第40页
    5.2 系统架构设计第40-42页
        5.2.1 系统整体架构设计第40-41页
        5.2.2 Web应用系统架构设计第41-42页
    5.3 短文本分类模块设计与实现第42-51页
        5.3.1 三阶段搜索词分类解决方案第42-44页
        5.3.2 黑白名单配置第44页
        5.3.3 文本预处理第44-46页
        5.3.4 特征选择与特征加权第46-48页
        5.3.5 构建分类器第48页
        5.3.6 反馈学习第48-51页
第六章 总结和展望第51-53页
    6.1 工作总结第51-52页
    6.2 展望第52-53页
参考文献第53-55页
致谢第55页

论文共55页,点击 下载论文
上一篇:再生混凝土砌块及其无砂浆砌体力学性能实验研究
下一篇:基于业务流程的CIM建模及CIM-to-PIM转换方法的研究