首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于主题的文本分类模型研究与应用

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第11-16页
    1.1 研究工作的背景与意义第11-12页
    1.2 国内外研究历史与现状第12-14页
    1.3 论文主要贡献与创新第14页
    1.4 论文章节安排第14-16页
第二章 文本分类和主题模型相关基础第16-29页
    2.1 特征选择第16-20页
        2.1.1 基于文档频率的特征选择第17页
        2.1.2 基于信息增益的特征选择第17-18页
        2.1.3 基于互信息的特征选择第18-19页
        2.1.4 基于卡方的特征选择第19-20页
    2.2 主题模型第20-22页
        2.2.1 主题第20-21页
        2.2.2 相关语言模型第21-22页
            2.2.2.1 统计语言模型第21页
            2.2.2.2 N元语言模型第21页
            2.2.2.3 一元混合语言模型第21-22页
            2.2.2.4 pLSA模型第22页
    2.3 潜在狄利克雷分布第22-24页
        2.3.1 术语定义第23页
        2.3.2 生成过程第23-24页
    2.4 支持向量机第24-28页
        2.4.1 线性可分第25-27页
        2.4.2 线性不可分第27-28页
    2.5 本章小结第28-29页
第三章 基于LDA的文本分类第29-40页
    3.1 基于SVM的多分类实现方法第29-32页
        3.1.1 一对多(OVA,One-versus-all)方法第30-31页
        3.1.2 多对多(AVA,All-versus-all)方法第31页
        3.1.3 ECOC(Error-Correcting Output-Coding)方法第31-32页
    3.2 基于LDA主题模型的文本分类模型第32-33页
    3.3 实验环境第33-36页
        3.3.1 jGibbLDA实验环境搭建第33-35页
            3.3.1.1 文本的格式第34-35页
            3.3.1.2 输出文本的意义第35页
        3.3.2 SVM实验环境搭建第35-36页
            3.3.2.1 文本的格式第35-36页
            3.3.2.2 训练及预测过程第36页
    3.4 实验数据集第36-37页
    3.5 实验和结果分析第37-39页
    3.6 本章小结第39-40页
第四章 文本分类系统设计与实现第40-75页
    4.1 系统框架功能设计第40-42页
        4.1.1 文本系统实现的功能第40-42页
    4.2 数据存储第42-44页
        4.2.1 包信息表第42-43页
        4.2.2 邮件信息表第43页
        4.2.3 邮件地址表第43-44页
        4.2.4 词字典表第44页
    4.3 系统数据类型第44-47页
    4.4 文本向量化模块第47-51页
        4.4.1 ICTCLAS中文分词第47-48页
        4.4.2 向量空间模型第48-49页
        4.4.3 模块流程第49-50页
        4.4.4 输入输出第50页
        4.4.5 数据结构第50页
        4.4.6 功能结构第50-51页
    4.5 特征选择模块第51-56页
        4.5.1 模块流程第52页
        4.5.2 输入输出第52页
        4.5.3 数据结构第52-53页
        4.5.4 功能结构第53-56页
    4.6 文本分类模块第56-60页
        4.6.1 模块流程第57-58页
        4.6.2 输入输出第58页
        4.6.3 数据结构第58页
        4.6.4 功能结构第58-60页
    4.7 性能评估模块第60-65页
        4.7.1 文本分类的评估准则第60-62页
        4.7.2 模块流程第62-63页
        4.7.3 输入输出第63页
        4.7.4 数据结构第63页
        4.7.5 功能结构第63-65页
    4.8 报表模块第65-70页
        4.8.1 模块流程第65页
        4.8.2 输入输出第65-66页
        4.8.3 数据结构第66页
        4.8.4 功能结构第66-70页
    4.9 系统界面及操作第70-74页
        4.9.1 数据导入界面及其操作第71-72页
        4.9.2 分类训练界面及其操作第72-73页
        4.9.3 分类预测界面及其操作第73-74页
    4.10 本章小结第74-75页
第五章 结束语第75-77页
    5.1 全文总结第75-76页
    5.2 后续工作展望第76-77页
致谢第77-78页
参考文献第78-80页
攻读硕士学位期间取得的成果第80-81页

论文共81页,点击 下载论文
上一篇:SGML到XML格式转换技术及应用
下一篇:基于ArcGIS城乡一体化地籍信息管理系统的设计与实现