首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

不文明微博帖的自动识别方法研究

摘要第5-6页
Abstract第6-7页
第一章 绪论第10-17页
    1.1 研究背景与意义第10-12页
    1.2 选题来源第12-13页
    1.3 国内外研究现状第13-14页
    1.4 本文的主要研究内容第14-16页
    1.5 论文组织结构第16-17页
第二章 相关研究综述第17-28页
    2.1 文本分类基本方法第17-21页
        2.1.1 朴素贝叶斯分类第17-18页
        2.1.2 决策树分类第18-19页
        2.1.3 支持向量机第19-21页
    2.2 统计语言模型第21-25页
        2.2.1 上下文无关模型第21-22页
        2.2.2 N-gram模型第22-23页
        2.2.3 隐马尔可夫模型第23-24页
        2.2.4 最大熵模型第24-25页
    2.3 中文分词方法第25-27页
        2.3.1 基于规则的方法第25-27页
        2.3.2 基于统计的方法第27页
    2.4 本章小结第27-28页
第三章 不文明微博语料库的构建第28-41页
    3.1 微博数据提取第28-33页
        3.1.1 用户种子提取第28-31页
        3.1.2 用户数据下载第31-33页
    3.2 语料筛选第33-37页
        3.2.1 语料分析第34-35页
        3.2.2 不文明种子词表的构建第35-36页
        3.2.3 语料过滤第36-37页
    3.3 语料存储第37-40页
        3.3.1 数据解析第37-39页
        3.3.2 索引式存储第39-40页
    3.4 本章小结第40-41页
第四章 不文明微博帖自动识别系统第41-63页
    4.1 基于朴素贝叶斯的分类模型第41-50页
        4.1.1 朴素贝叶斯分类的可行性分析第41-43页
        4.1.2 基于Bigram的文本切分与特征选取第43-47页
        4.1.3 训练集的动态构建第47-49页
        4.1.4 模型的训练和使用第49-50页
    4.2 不文明用语分类实验第50-58页
        4.2.1 人工标注第51-53页
        4.2.2 分类器训练第53-54页
        4.2.3 实验与结果分析第54-58页
    4.3 不文明缩写识别模型第58-60页
        4.3.1 不文明缩写识别方法第58-59页
        4.3.2 实验结果分析第59-60页
    4.4 不文明微博自动识别系统的应用第60-62页
        4.4.1 用户个体分析第60-61页
        4.4.2 语言趋势分析第61-62页
    4.5 本章小结第62-63页
第五章 总结与展望第63-65页
    5.1 本文总结第63页
    5.2 展望第63-65页
参考文献第65-69页
攻读硕士学位期间参与的科研项目与发表的论文第69-70页
致谢第70页

论文共70页,点击 下载论文
上一篇:基于同轴双波导光纤的模式干涉仪及其传感特性研究
下一篇:基于多特征反馈融合机制的视频检索关键技术研究