首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于词对伪文档的短文本主题模型研究

中文摘要第6-7页
英文摘要第7页
第一章 绪论第12-16页
    1.1 研究背景及意义第12-13页
    1.2 论文的内容和贡献第13-14页
    1.3 论文组织结构第14-16页
第二章 背景知识第16-26页
    2.1 引言第16页
    2.2 背景知识第16-20页
        2.2.1 词袋模型第16页
        2.2.2 词权重计算第16-18页
        2.2.3 词语相似性度量第18-19页
        2.2.4 潜在狄利克雷分配模型与吉布斯采样第19-20页
    2.3 研究现状第20-24页
        2.3.1 非概率主题模型第21-22页
        2.3.2 概率主题模型第22-23页
        2.3.3 短文本主题模型第23-24页
    2.4 本章小结第24-26页
第三章 基于词共现网络的伪文档构造第26-36页
    3.1 引言第26-27页
    3.2 词共现网络第27-28页
    3.3 词三角关系第28-29页
    3.4 词三角关系挖掘与伪文档集构造第29-31页
        3.4.1 词三角关系挖掘第29-30页
        3.4.2 伪文档集构造第30-31页
    3.5 伪文档集规模削减算法第31-35页
        3.5.1 主题模型时间复杂度分析第31-33页
        3.5.2 伪文档集规模削减算法第33-35页
    3.6 本章小结第35-36页
第四章 词对伪文档集主题模型第36-59页
    4.1 引言第36-37页
    4.2 词对伪文档集主题模型第37-41页
        4.2.1 词对伪文档集主题模型生成式算法第37-40页
        4.2.2 原文档主题判定第40-41页
    4.3 BPDTM模型参数学习第41-45页
    4.4 数据集与实验设置第45-49页
        4.4.1 数据集第45-47页
        4.4.2 数据预处理第47-49页
        4.4.3 实验环境第49页
    4.5 实验对比和分析第49-58页
        4.5.1 主题聚合度第49-52页
        4.5.2 文本聚类第52-56页
        4.5.3 文本分类第56-58页
    4.6 本章小结第58-59页
第五章 总结与展望第59-61页
    5.1 总结第59-60页
    5.2 展望第60-61页
参考文献第61-64页
致谢第64-65页
附录第65-66页

论文共66页,点击 下载论文
上一篇:基于敏感路径识别的安卓应用安全性分析方法
下一篇:制造物联网基于负载均衡的实时可靠传输策略研究