首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于机器学习的文本分类研究

摘要第4-6页
Abstract第6-7页
第1章 绪论第10-14页
    1.1 研究背景及意义第10页
    1.2 国内外研究现状第10-12页
        1.2.1 国内第11页
        1.2.2 国外第11-12页
    1.3 研究内容与目标第12页
    1.4 论文的组织结构第12-14页
第2章 相关技术概述第14-24页
    2.1 文本分类的一般流程第14-16页
        2.1.1 文本预处理第15页
        2.1.2 文本分词第15-16页
    2.2 主题模型第16-19页
        2.2.1 LDA模型基本思想第16-17页
        2.2.2 LDA模型的文档建模第17-19页
        2.2.3 对LDA模型的改进第19页
    2.3 决策树模型第19-23页
        2.3.1 划分选择第19-20页
        2.3.2 增益率第20-21页
        2.3.3 基尼指数第21页
        2.3.4 剪枝处理第21-22页
        2.3.5 连续与缺失值第22-23页
    2.4 本章小结第23-24页
第3章 基于LRM模型的链接关系文本分类研究第24-32页
    3.1 LRM模型第24-27页
        3.1.1 LRM模型简介第24-25页
        3.1.2 LRM模型的结构第25-27页
    3.2 LRM模型的推理过程第27-28页
    3.3 LRM模型的估算参数第28-29页
    3.4 LRM模型对链接关系文本分类第29-31页
        3.4.1 链接关系确定第29-30页
        3.4.2 链接关系提升分类的稳定性与准确性第30页
        3.4.3 链接文本分类第30-31页
    3.5 本章小结第31-32页
第4章 基于LDA-ID3混合模型的社交文本分类研究第32-42页
    4.1 混合模型第32-33页
    4.2 社交文本的特征第33-35页
        4.2.1 短文本数据预处理第34页
        4.2.2 特征扩展第34页
        4.2.3 特征稀疏问题的解决第34-35页
        4.2.4 未登录词解决第35页
    4.3 主题模型第35-37页
    4.4 决策树模型第37-40页
    4.5 本章小结第40-42页
第5章 实验及分析第42-50页
    5.1 文本预处理第42-43页
        5.1.1 区分文本类型第42页
        5.1.2 预处理第42-43页
    5.2 LRM模型的分类结果分析第43-47页
        5.2.1 性能分析第43-46页
        5.2.2 效果分析第46-47页
    5.3 LDA-ID3模型分类结果分析第47-49页
    5.4 本章小结第49-50页
结论第50-52页
参考文献第52-54页
攻读硕士学位期间所取得的研究成果第54-56页
致谢第56页

论文共56页,点击 下载论文
上一篇:云计算环境下可搜索加密算法的研究
下一篇:面向DAG计算框架的增量计算关键技术研究