首页--经济论文--工业经济论文--中国工业经济论文--工业部门经济论文

基于淘宝二手电子设备消费需求的文本挖掘

摘要第4-5页
Abstract第5页
1 绪论第8-14页
    1.1 研究背景及意义第8-9页
    1.2 国内外研究第9-12页
        1.2.1 国内研究第9-11页
        1.2.2 国外文献第11-12页
    1.3 论文主要内容第12-14页
2 基于文本相似性的垃圾文本信息过滤第14-19页
    2.1 局部哈希敏感算法介绍第14-15页
    2.2 文本相似性度量指标第15-17页
        2.2.1 夹角余弦(Cosine)距离第15-16页
        2.2.2 海明距离第16页
        2.2.3 杰卡德距离第16-17页
    2.3 基于局部哈希敏感算法的网络垃圾信息过滤技术实现第17-19页
3 淘宝二手交易文本的主题聚类第19-24页
    3.1 基于主题模型的语义相似性算法原理第19-21页
        3.1.1 国内外研究第19页
        3.1.2 参数估计方法——Gibbs抽样第19-21页
    3.2 主题模型中的复杂度以及对数似然值理论第21-22页
    3.3 主题模型中词语与主题之间的相似性第22页
    3.4 主题模型中主题之间的相似性第22-24页
4 淘宝二手交易文本的情绪识别第24-27页
    4.1 非监督式情感分析原理第24-25页
        4.1.1 基础情感词典第24页
        4.1.2 非监督式情感分析理论第24-25页
        4.1.3 Ansj中文分词工具第25页
    4.2 监督式情感分析原理第25-27页
5 基于词向量技术的二手交易文本数据结构化第27-33页
    5.1 词向量技术概述第27-28页
        5.1.1 One-Hot词表示第27页
        5.1.2 Distributed词表示第27-28页
    5.2 word2vec算法原理第28-30页
    5.3 基于词向量的二手交易市场相似话题探究第30-33页
6 淘宝二手电子设备消费者的用户画像第33-46页
    6.1 数据预处理与描述第34-35页
        6.1.1 数据词云图第34页
        6.1.2 不同品牌在淘宝会员等级分布第34-35页
    6.2 基于主题模型的用户话题偏好第35-38页
        6.2.1 主题模型最优主题数量甄别第35-36页
        6.2.2 LDA主题模型主题相似性探究第36-38页
    6.3 基于情感分析的用户情感偏好第38-41页
    6.4 二手交易市场的多维度用户画像第41-46页
7 总结与展望第46-49页
    7.1 总结第46-48页
    7.2 展望第48-49页
参考文献第49-52页
致谢第52-53页
攻读硕士学位期间的科研成果及获奖荣誉第53页

论文共53页,点击 下载论文
上一篇:青青稞酒战略预算管理研究
下一篇:我国创业板上市公司并购动因及绩效研究--L机电股份有限公司为例