首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

结合传统计数特征和基于词嵌入特征的中文问答方法

摘要第4-5页
ABSTRACT第5页
第1章 绪论第8-10页
    1.1 研究背景第8-9页
    1.2 论文结构第9-10页
第2章 文本表征第10-28页
    2.1 传统的基于计数的文本表示第10-14页
        2.1.1 布尔模型和向量空间模型第11-12页
        2.1.2 潜在语义索引第12-13页
        2.1.3 概率化潜在语义索引第13页
        2.1.4 潜在狄利克雷分布第13-14页
    2.2 词向量技术第14-19页
        2.2.1 神经网络语言模型第14-16页
        2.2.2 C&W模型第16页
        2.2.3 Cbow模型和Skip-gram模型第16-18页
        2.2.4 词向量技术的比较第18-19页
    2.3 基于词向量技术的文本建模第19-25页
        2.3.1 经典词向量表示方法第19-22页
        2.3.2 match过程中的文本建模问题第22-25页
    2.4 预测方式和技术方式的区别和优劣第25-26页
    2.5 中文字词向量技术第26-28页
第3章 回归和排序方法第28-35页
    3.1 线性回归第28页
    3.2 集成学习第28-31页
        3.2.1 Boosting和bagging第28-30页
        3.2.2 MART第30-31页
    3.3 排序学习第31-35页
        3.3.1 RankNet第31-32页
        3.3.2 LambdaRank第32-33页
        3.3.3 LambdaMART第33-35页
第4章 中文问答方法第35-49页
    4.1 相关工作第36-39页
        4.1.1 问答任务简介第36-38页
        4.1.2 相关问答数据集第38-39页
    4.2 数据探测第39-42页
        4.2.1 基本统计第39-42页
    4.3 数据预处理第42-43页
    4.4 特征工程第43-46页
        4.4.1 问题种类和答案分类第43页
        4.4.2 字词重叠第43-44页
        4.4.3 BM25第44页
        4.4.4 加权词向量第44页
        4.4.5 神经网络第44-46页
        4.4.6 其他特征第46页
    4.5 模型融合第46页
    4.6 模型评价第46-47页
    4.7 实验结果第47-49页
第5章 结论和思考第49-51页
    5.1 总结第49页
    5.2 展望第49-50页
    5.3 思考第50-51页
参考文献第51-55页
发表论文和参加科研情况说明第55-56页
致谢第56-58页

论文共58页,点击 下载论文
上一篇:基于噪声过滤及修正的鲁棒流数据分类
下一篇:基于空间上下文的场景理解方法研究