首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向微博的文本质量评估与分类技术研究与实现

摘要第8-9页
ABSTRACT第9页
第一章 绪论第10-19页
    1.1 研究背景与意义第10-16页
        1.1.1 在线社交网络第10-12页
        1.1.2 短文本分类第12-13页
        1.1.3 推荐系统第13-15页
        1.1.4 文本主客观分类第15页
        1.1.5 研究意义第15-16页
    1.2 本文主要工作第16-17页
    1.3 论文结构第17-19页
第二章 相关技术研究第19-30页
    2.1 文本相似度计算第19-22页
        2.1.1 TF · IDF与余弦定理计算文本相似度第19-20页
        2.1.2 汉明距离第20-21页
        2.1.3 莱温斯坦距离第21页
        2.1.4 Jaro距离第21-22页
    2.2 机器学习第22页
    2.3 短文本分类技术第22-25页
    2.4 文本分类特征选取第25-26页
    2.5 主客观分类第26-27页
    2.6 文本质量评估第27-28页
    2.7 动态阈值技术第28页
    2.8 Twitter相关研究第28-29页
    2.9 本章小结第29-30页
第三章 面向微博的文本质量评估模型第30-52页
    3.1 相关概念第30-32页
        3.1.1 JSON数据格式第30-31页
        3.1.2 Twitter数据格式第31-32页
    3.2 模型总览第32-33页
    3.3 预处理模块第33-36页
    3.4 网址扩展第36页
    3.5 文本质量计算第36-37页
    3.6 推送策略第37-39页
    3.7 文本质量评估系统实现第39-45页
        3.7.1 模拟实验设计第39页
        3.7.2 问题分析第39-41页
        3.7.3 文本预处理模块第41-42页
        3.7.4 网址扩展模块第42-44页
        3.7.5 关键词抽取模块第44-45页
    3.8 系统实验与结果分析第45-51页
        3.8.1 推送测试结果第49-51页
    3.9 本章小结第51-52页
第四章 面向微博的文本主客观分类算法第52-59页
    4.1 基于 2-POS模式的文本主客观分类方法介绍与分析第52-53页
        4.1.1 N-POS模式介绍第52-53页
        4.1.2 分类方法分析第53页
    4.2 基于 2-both-POS模式的文本主客观分类算法第53-55页
    4.3 算法实验与结果第55-58页
        4.3.1 排序表评价实验第56页
        4.3.2 主客观分类实验第56-58页
    4.4 本章小结第58-59页
第五章 结束语第59-62页
    5.1 工作总结第59-60页
    5.2 工作展望第60-62页
致谢第62-63页
参考文献第63-68页
作者在学期间取得的学术成果第68页

论文共68页,点击 下载论文
上一篇:无重叠约束的序列模式挖掘
下一篇:面向大规模开源软件的日志增强技术研究