首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

用户短文本相关技术方法研究

摘要第6-7页
Abstract第7-8页
第1章 绪论第13-21页
    1.1 研究背景和意义第13-14页
    1.2 国内外研究现状第14-18页
        1.2.1 国内外文本聚类研究现状第14-15页
        1.2.2 文本聚类研究重点第15-18页
    1.3 本文的主要工作第18页
    1.4 本文的组织结构安排第18-21页
第2章 相关理论与技术第21-31页
    2.1 文本预处理第21-22页
        2.1.1 中文分词技术第21-22页
        2.1.2 停用词处理第22页
    2.2 中文文本表示模型第22-26页
        2.2.1 空间向量模型第22-23页
        2.2.2 潜在语义分析模型(LSA)第23-24页
        2.2.3 概率潜在语义分析模型(PLSA)第24页
        2.2.4 潜在狄利克雷模型(LDA)第24-25页
        2.2.5 词的分布式表示第25-26页
    2.3 文本聚类算法第26-29页
        2.3.1 层次聚类算法第26页
        2.3.2 基于划分的聚类算法第26-27页
        2.3.3 基于概率的聚类算法第27页
        2.3.4 基于密度的聚类算法第27页
        2.3.5 文本相似度计算第27-28页
        2.3.6 聚类结果评估第28-29页
    2.4 本章小结第29-31页
第3章 用户短文本无关语自动识别方法第31-39页
    3.1 无关语的概念及特点分析第31-32页
    3.2 基于多特征的无关语自动识别方法第32-36页
        3.2.1 模型选择第32-34页
        3.2.2 语料预处理第34页
        3.2.3 扩展二阶隐马尔科夫模型参数训练第34-35页
        3.2.4 基于融合多特征的维特比算法的标记预测第35-36页
    3.3 实验结果与分析第36-38页
        3.3.1 实验语料与实验参数第36-37页
        3.3.2 实验结果对比分析第37-38页
    3.4 本章小结第38-39页
第4章 基于词向量的短文本聚类方法第39-55页
    4.1 短文本聚类流程第39-40页
    4.2 短文本预处理第40-41页
    4.3 词向量的获取第41-43页
    4.4 基于词向量的短文本向量生成方法第43-44页
    4.5 基于词向量的短文本特征扩展第44-46页
    4.6 基于词向量的短文本聚类算法实现第46-48页
        4.6.1 离线聚类算法第46-48页
        4.6.2 在线聚类算法第48页
    4.7 实验结果与分析第48-52页
        4.7.1 词向量训练实验第48-51页
        4.7.2 咨询短文本聚类实验第51-52页
    4.8 本章小结第52-55页
第5章 总结与展望第55-57页
参考文献第57-60页
攻读学位期间发表的论文第60-62页
致谢第62页

论文共62页,点击 下载论文
上一篇:基于VOx阻变存储器的阻变特性优化的研究
下一篇:辽宁东部短缺资料地区洪水预报方法研究