首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于机器学习的短文本分类在核电质量管理中的研究与应用

摘要第3-4页
abstract第4-5页
1 绪论第9-15页
    1.1 课题背景及意义第9-10页
        1.1.1 概述第9-10页
        1.1.2 企业技术问题的知识管理第10页
    1.2 设备质量管理语料库第10-11页
    1.3 短文本分类的国内外研究现状第11页
    1.4 本文的研究内容和创新性工作第11-13页
    1.5 论文的篇章结构第13-15页
2 相关理论及技术第15-24页
    2.1 机器学习第15-16页
    2.2 自然语言处理第16页
    2.3 语言模型第16-17页
        2.3.1 词袋模型第16页
        2.3.2 N-gram模型第16-17页
    2.4 人工神经网络第17-20页
        2.4.1 神经网络第17-18页
        2.4.2 深度学习第18-19页
        2.4.3 卷积神经网络第19-20页
    2.5 分词技术第20-22页
        2.5.1 基于词典的分词方法第21页
        2.5.2 基于字token的统计分词方法第21-22页
    2.6 基于正则表达式技术的语料管理第22-24页
3 设备质量管理短文本分类过程第24-49页
    3.1 本项目语料库的预处理过程第24-25页
    3.2 短文本的停用词预处理第25-26页
        3.2.1 第一类停用词第25页
        3.2.2 第二类停用词第25-26页
    3.3 特定领域内的新词抽取和分词第26-29页
        3.3.1 领域内新词第26-27页
        3.3.2 新词抽取技术第27-28页
        3.3.3 设备专有领域的分词第28-29页
    3.4 领域文本特征工程第29-32页
        3.4.1 概述第29-30页
        3.4.2 本项目特征工程第30-32页
    3.5 基于机器学习的事件短文本分类第32-49页
        3.5.1 算法实验及环境第33-34页
        3.5.2 Labeled主题模型算法第34-42页
        3.5.3 基于支持向量机(SVMs)短文本分类方法第42-45页
        3.5.4 卷积神经网络的方法第45-49页
4 核电项目设备问题项管理系统第49-62页
    4.1 背景介绍第49-50页
    4.2 设备问题项处理信息系统的NLP开发第50-51页
    4.3 领域内新词(未登录词)抽取模块第51-55页
        4.3.1 模块设计与实现第51-53页
        4.3.2 实验结果和分析第53-55页
    4.4 基于CRF的分词模块第55-58页
        4.4.1 模块设计与实现第55-56页
        4.4.2 基于CRF的分词结果与分析第56-58页
    4.5 文本分类模块第58-60页
        4.5.1 文本分类算法的选择第58-59页
        4.5.2 模块设计和实现第59-60页
    4.6 系统功能验证第60-62页
5 本短文本分类项目的应用展望第62-64页
参考文献第64-66页
致谢第66-67页
攻读学位期间发表的学术论文目录第67-69页

论文共69页,点击 下载论文
上一篇:基于AUTOSAR标准的CAN通信栈设计与实现
下一篇:通用航空综合服务保障系统的设计与实现