首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Scrapy爬取电商平台数据及自动问答系统的构建

摘要第5-6页
Abstract第6-7页
第一章 绪论第10-17页
    1.1 课题研究背景第10-11页
    1.2 研究现状第11-15页
        1.2.1 网络爬虫的研究现状第11-12页
        1.2.2 问答系统的研究现状第12-14页
        1.2.3 存在的问题第14-15页
    1.3 本文的研究目标与工作第15页
    1.4 论文的组织结构第15-17页
第二章 研究基础第17-27页
    2.1 网络爬虫介绍第17-18页
        2.1.1 网络爬虫的工作原理第17页
        2.1.2 网页去重第17-18页
    2.2 Scrapy的详细介绍第18-20页
    2.3 正则表达式第20-22页
    2.4 可视化技术第22-24页
        2.4.1 可视化介绍第22-23页
        2.4.2 D3简介第23-24页
    2.5 自动问答系统第24-26页
        2.5.1 问答系统的原理第24页
        2.5.2 问答系统关键技术第24-26页
    2.6 本章小结第26-27页
第三章 爬取考拉数据的自动问答系统整体框架第27-31页
    3.1 总体架构设计第27-28页
    3.2 爬虫模块第28页
    3.3 可视化模块第28-29页
    3.4 中文自动问答系统模块第29-30页
    3.5 本章小结第30-31页
第四章 基于Scrapy的数据爬虫设计实现第31-41页
    4.1 分析网易考拉网站第31-32页
    4.2 利用正则表达式提取数据第32-34页
    4.3 爬取模块的设计实现第34-40页
        4.3.1 创建项目及文件解释第35-36页
        4.3.2 实现Item容器第36-37页
        4.3.3 定义数据输出第37页
        4.3.4 设置代理与防止死循环第37-38页
        4.3.5 处理编码格式第38页
        4.3.6 编写Spider模块第38-40页
    4.4 本章小结第40-41页
第五章 基于D3的考拉商品可视化设计实现第41-48页
    5.1 可视化设计第41-44页
        5.1.1 “开关”设计第41-42页
        5.1.2 重绘函数设计第42-44页
    5.2 考拉商品可视化实现第44-47页
    5.3 本章小结第47-48页
第六章 简易自动问答系统的设计实现第48-61页
    6.1 KOALAASK工具的功能设计实现第48-55页
        6.1.1 KOALAASK工具的动态模型第48-49页
        6.1.2 KOALAASK分词与词性标注第49-51页
        6.1.3 KOALAASK关键词提取第51-52页
        6.1.4 KOALAASK相似度的计算第52-55页
    6.2 KOALAASK工具的测试第55-60页
        6.2.1 功能性实验第55-58页
        6.2.2 实验结果的分析第58-60页
    6.3 本章小结第60-61页
第七章 总结和展望第61-63页
    7.1 本文工作的总结第61-62页
    7.2 进一步的研究工作第62-63页
参考文献第63-68页
附录第68-70页
在校期间参加的科研项目和发表的论文第70-71页
致谢第71页

论文共71页,点击 下载论文
上一篇:混合无线传感器网络覆盖控制研究
下一篇:基于Solr的海量数据并行索引及搜索缓存研究