首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文微博中的问题检测技术研究

摘要第5-6页
Abstract第6页
第一章 绪论第7-13页
    1.1 研究背景与研究意义第7-8页
    1.2 相关工作第8-10页
    1.3 难点第10-11页
        1.3.1 中文疑问词的复杂性第10-11页
        1.3.2 中文未登录词第11页
    1.4 本文概述及主要贡献第11-12页
    1.5 本文组织结构第12-13页
第二章 微博中的问题分类及检测方法第13-22页
    2.1 微博中的问题分类第13-16页
        2.1.1 问题分类实例第14-16页
        2.1.2 中英文微博中的问题分布统计第16页
    2.2 问题检测方法第16-18页
        2.2.1 朴素贝叶斯(Naive Bayes)分类器第17-18页
        2.2.2 线性分类器第18页
    2.3 传统特征选取方法第18-21页
        2.3.1 疑问词第19-20页
        2.3.2 N-Gram第20页
        2.3.3 序列模式(Sequential Pattern)第20-21页
    2.4 本章小结第21-22页
第三章 面向微博的中文分词第22-33页
    3.1 中文分词概述第22-23页
    3.2 基于字聚类的中文分词第23-28页
        3.2.1 序列标注第23-25页
        3.2.2 基于半监督K-means的中文字聚类第25-28页
    3.3 实验第28-31页
        3.3.1 数据集第28-29页
        3.3.2 实验设置第29页
        3.3.3 实验结果第29-31页
        3.3.4 分析第31页
    3.4 本章小结第31-33页
第四章 基于依存句法树模式的特征抽取第33-42页
    4.1 句法结构概述第33-34页
    4.2 句法结构对问题检测的重要性第34-35页
    4.3 依存句法树模式定义第35-36页
    4.4 依存句法树模式抽取第36-41页
        4.4.1 生成候选子树第37-38页
        4.4.2 子树合法性检查第38-39页
        4.4.3 模式泛化第39-41页
    4.5 本章小结第41-42页
第五章 中文微博问题检测实验及分析第42-52页
    5.1 数据集第42-43页
    5.2 评价标准第43页
    5.3 实验设置第43-45页
    5.4 问题微博判断效果及分析第45-47页
    5.5 问题完备性判断效果及分析第47-49页
    5.6 基于字聚类的分词方法的影响第49-50页
    5.7 深度的影响第50-51页
    5.8 错误分析第51页
    5.9 本章小结第51-52页
第六章 总结及未来工作第52-54页
参考文献第54-58页
硕士期间发表论文第58-59页
致谢第59-60页

论文共60页,点击 下载论文
上一篇:ECT B样条曲线的递推算法
下一篇:图像目标显著性检测的研究与应用