首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

微博用户性别判断分析与研究

摘要第3-4页
Abstract第4页
1 绪论第8-14页
    1.1 研究背景第8-9页
    1.2 研究意义第9-10页
    1.3 研究现状第10-11页
        1.3.1 监督学习的性别判断研究第10页
        1.3.2 半监督学习的性别判断研究第10-11页
    1.4 研究内容第11-12页
    1.5 结构框架第12-14页
2 相关概念与技术论述第14-23页
    2.1 短文本第14页
    2.2 文本表示模型第14-17页
        2.2.1 向量空间表示模型第15页
        2.2.2 潜在主题表示模型第15-16页
        2.2.3 N元模型第16-17页
    2.3 特征提取第17-19页
        2.3.1 TF-IDF第17-18页
        2.3.2 互信息第18-19页
        2.3.3 信息增益第19页
    2.4 机器学习分类方法第19-22页
        2.4.1 最大熵分类第19-20页
        2.4.2 支持向量机第20-22页
    2.5 本章小结第22-23页
3 基于原创微博的用户性别判断分析研究第23-40页
    3.1 问题的研究与分析第23页
    3.2 相关模型介绍第23-27页
        3.2.1 LDA主题模型第23-25页
        3.2.2 word2vec模型第25-27页
    3.3 LDA与word2vec模型结合的分类方法第27-30页
        3.3.1 分类方法整体流程第27-28页
        3.3.2 文档获取及处理方法第28页
        3.3.3 LDA与word2vec结合模型第28-30页
        3.3.4 分类器分类第30页
    3.4 实验与结果分析第30-38页
        3.4.1 软硬件环境第30-31页
        3.4.2 实验数据采集与预处理第31-34页
        3.4.3 结合模型生成第34-36页
        3.4.4 分类和结果分析第36-38页
    3.5 本章小结第38-40页
4 基于多视图tri-training算法的用户性别判断分析研究第40-48页
    4.1 问题的研究与分析第40-41页
    4.2 多视图分析与建立第41-42页
        4.2.1 用户原创微博视图第41页
        4.2.2 微博用户标签视图第41页
        4.2.3 微博用户昵称视图第41-42页
    4.3 改进tri-training算法第42-45页
        4.3.1 tri-training算法的不足第42-43页
        4.3.2 tri-training算法的改进第43-44页
        4.3.3 改进后算法流程第44-45页
    4.4 实验结果与分析第45-47页
    4.5 本章小结第47-48页
5 总结与展望第48-50页
    5.1 总结第48页
    5.2 展望第48-50页
致谢第50-51页
参考文献第51-54页
附录1攻读硕士学位期间参与的项目和发表论文第54-55页
附录2主要英文缩写语对照表第55页

论文共55页,点击 下载论文
上一篇:梗丝形态指数模型的建立及均匀性评价方法研究
下一篇:虚拟/增强现实技术下出版物场景化传播研究