首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于数据采集的电商评论分析系统的研究

摘要第3-4页
abstract第4-5页
1 绪论第8-15页
    1.1 本文研究背景及意义第8-10页
    1.2 国内外研究现状第10-13页
        1.2.1 爬虫发展现状第10-11页
        1.2.2 中文分词发展现状第11-12页
        1.2.3 文本挖掘发展现状第12-13页
    1.3 论文组织结构第13-15页
2 电商评论爬取第15-33页
    2.1 传统爬虫的基本原理与算法策略第15-18页
        2.1.1 基本原理第15-17页
        2.1.2 通用算法第17-18页
    2.2 改进型爬虫策略第18-21页
        2.2.1 改进爬虫程序的必要性第18-19页
        2.2.2 爬取策略的选择与改进第19-21页
    2.3 爬虫程序总体设计第21-26页
        2.3.1 爬取对象以及总体架构第21-22页
        2.3.2 Scrapy爬虫程序框架第22-23页
        2.3.3 爬虫数据库选择第23-24页
        2.3.4 针对反爬机制的策略第24-26页
    2.4 爬虫程序具体实现第26-32页
        2.4.1 爬虫实现细节第26-30页
        2.4.2 访问限制以及速度改进第30-31页
        2.4.3 结果展示及后续维护第31-32页
    2.5 本章小结第32-33页
3 电商评论数据预处理第33-51页
    3.1 问题描述第33-34页
    3.2 模型的选择与改进第34-44页
        3.2.1 RNN和经典的LSTM神经网络第34-41页
        3.2.2 CRF模型第41-42页
        3.2.3 改进的BI-LSTMN-CRF模型第42-44页
    3.3 模型建立第44-50页
        3.3.1 文本向量化第44-48页
        3.3.2 过拟合处理第48-49页
        3.3.3 模型训练第49-50页
    3.4 结果分析第50页
    3.5 本章小结第50-51页
4 电商评价信息文本挖掘第51-66页
    4.1 文本挖掘模型第51-54页
        4.1.1 主题模型第51-53页
        4.1.2 条件随机场模型第53-54页
    4.2 方面与评价词抽取第54-61页
        4.2.1 抽取对象的说明第54-55页
        4.2.2 LDA主题模型的建模与训练第55-57页
        4.2.3 获取方面和评价词集合第57-58页
        4.2.4 CRF++工具特征模版第58-59页
        4.2.5 方面与评价词抽取过程第59-61页
    4.3 情感方向以及强度分析第61-64页
        4.3.1 文本标点切分及方面合并第62页
        4.3.2 评论有无情感色彩识别第62-63页
        4.3.3 情感方向分类第63-64页
        4.3.4 情感强度分类第64页
    4.4 模型评价第64-65页
    4.5 本章小结第65-66页
5 产品评论挖掘展示系统的构建第66-73页
    5.1 系统框架第66-67页
        5.1.1 JFinal第66-67页
        5.1.2 JFinal使用的优势第67页
    5.2 产品评价打分模型第67-68页
    5.3 系统对应数据库模型第68-69页
        5.3.1 MySQL数据库的优势第68页
        5.3.2 数据对应数据库的数据结构第68-69页
    5.4 数据展示图形组件第69页
    5.5 系统评分流程第69-70页
    5.6 系统展示第70-72页
    5.7 本章小结第72-73页
总结与展望第73-74页
参考文献第74-77页
致谢第77-78页
攻读学位期间发表学术论文目录第78-79页

论文共79页,点击 下载论文
上一篇:基于人体红外图像的体内热分析建模方法研究
下一篇:雾化降质光学图像的实时复原技术研究