首页--经济论文--贸易经济论文--中国国内贸易经济论文--商品流通论文--电子贸易、网上贸易论文

基于爬虫与数据挖掘的电商页面信息分析

摘要第3-4页
abstract第4-5页
第一章 绪论第8-12页
    1.1 研究背景及意义第8页
    1.2 研究综述第8-9页
    1.3 研究内容及其特点第9-10页
    1.4 研究框架及结构安排第10-12页
第二章 获取数据方法介绍第12-16页
    2.1 网络爬虫概述第12页
    2.2 爬虫框架简介第12-13页
    2.3 爬虫工具的使用第13-16页
        2.3.1 python爬虫工具第13-14页
        2.3.2 爬虫协议的限制第14页
        2.3.3 非关系型数据库MongoDB第14页
        2.3.4 Selenium框架在爬虫中的作用第14-16页
第三章 网页数据处理方法第16-20页
    3.1 多元回归分析第16-17页
    3.2 中文文本聚类分析概述第17-20页
        3.2.1 聚类分析的思想第17-18页
        3.2.2 文本聚类的过程第18-19页
        3.2.3 聚类分析在电商网页信息分析中的作用第19-20页
第四章 基于K-Means算法的文本聚类第20-27页
    4.1 K-Means算法概述第20-21页
        4.1.1 K-Means 算法(K 均值聚类算法)第20页
        4.1.2 K-Means算法流程第20-21页
    4.2 文本数据预处理第21-23页
        4.2.1 中文文本分词第21-22页
        4.2.2 停用词过滤第22-23页
    4.3 文本相似度计算第23-25页
        4.3.1 TF-IDF算法第23-24页
        4.3.2 VSM算法第24-25页
    4.4 K-Means算法评价第25-27页
第五章 电商网页信息的聚类实现过程第27-39页
    5.1 环境配置第27页
    5.2 数据来源及信息选择第27-29页
        5.2.1 数据获取第27-28页
        5.2.2 数据存储与提取第28-29页
    5.3 描述性分析第29-32页
    5.4 多元回归分析第32-34页
    5.5 文本聚类分析第34-36页
        5.5.1 数据预处理第34-35页
        5.5.2 文本相似度计算第35-36页
        5.5.3 K-Means聚类第36页
    5.6 结果分析与评价第36-39页
第六章 总结与展望第39-40页
    6.1 总结第39页
    6.2 研究展望第39-40页
参考文献第40-43页
致谢第43页

论文共43页,点击 下载论文
上一篇:农贸市场从业人员城市适应性分析
下一篇:故事性广告对购买意愿的影响研究--基于眼动数据的分析