首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于种子词的无监督文本分类

摘要第4-5页
ABSTRACT第5页
1 绪论第8-11页
    1.1 研究的背景与意义第8-9页
    1.2 模型主要创新点第9-11页
2 概览第11-16页
    2.1 文本分类领域的研究现状第11-13页
    2.2 STM模型介绍第13-16页
3 相关工作第16-23页
    3.1 无监督文本分类第16-20页
        3.1.1 半监督分类方法第16页
        3.1.2 最大熵分类方法第16-17页
        3.1.3 基于外部知识库的分类方法第17-18页
        3.1.4 基于LDA的分类方法第18-20页
    3.2 文本分类相关技术第20-23页
        3.2.1 话题模型LDA第20-21页
        3.2.2 词植入技术第21-23页
4 基于种子词的无监督文本分类模型第23-33页
    4.1 STM模型设计第23-29页
        4.1.1 类别相关词第24-25页
        4.1.2 文本的初始类别分布估计第25页
        4.1.3 "类别相关话题"和"一般话题"第25-29页
    4.2 推理和参数估计第29-33页
        4.2.1 话题类型采样概率式的推断第29-30页
        4.2.2 类别相关话题采样概率式的推断第30-31页
        4.2.3 一般话题在类别下的分布第31页
        4.2.4 一般话题在文本下的分布第31页
        4.2.5 词在类别相关话题下的分布第31-32页
        4.2.6 词在一般话题下的分布第32页
        4.2.7 话题与控制变量的联合采样第32-33页
5 实验第33-51页
    5.1 数据集第33-34页
    5.2 实验设置第34-38页
        5.2.1 参数设置第34-35页
        5.2.2 比较方法第35-36页
        5.2.3 实验设置第36页
        5.2.4 种子词选择第36-37页
        5.2.5 数据集统计第37-38页
    5.3 实验结果与参数分析第38-51页
        5.3.1 实验结果第38-43页
        5.3.2 参数分析第43-51页
6. 总结和以后的工作第51-52页
7. 参考文献第52-54页
8. 硕士期间发表论文情况第54-55页
9. 致谢第55-56页

论文共56页,点击 下载论文
上一篇:高海拔条件下地山雀合作繁殖系统的进化
下一篇:不同母岩和林龄杉木人工林土壤磷素形态特征研究