首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

林产品贸易“暗网”信息获取方法研究

摘要第1-4页
ABSTRACT第4-7页
1 绪论第7-14页
   ·研究背景第7-9页
     ·林产品贸易概述第7页
     ·林产品贸易信息化现状第7-9页
   ·研究现状第9-11页
   ·研究内容和预期成果第11-12页
   ·技术路线第12-14页
2 相关概念与技术综述第14-19页
   ·林产品第14页
   ·贸易第14页
   ·门户网站第14页
   ·暗网第14-15页
   ·网页URL第15页
   ·相对URL第15页
   ·网络爬虫第15-16页
   ·聚焦爬虫第16页
   ·robots.txt文件第16页
   ·链接去重第16页
   ·进程第16页
   ·多线程第16-17页
   ·例行性任务第17页
   ·正则表达式第17页
   ·CSS类第17页
   ·MD5算法第17-18页
   ·sleep机制第18页
   ·网站特征第18-19页
3 林产品贸易信息获取与实现第19-32页
   ·林产品分类及编码方式第19-27页
   ·信息源的选择第27页
   ·国内主流林产品网站分类第27-29页
   ·对象处理方案第29-32页
     ·具有两级分类结构的网站第30页
     ·分类结构混乱与无分类结构的网站第30-32页
4 实现与结果分析第32-49页
   ·开发运行环境第32-33页
     ·开发语言及开发环境第32-33页
     ·运行环境第33页
   ·体系结构第33-34页
   ·数据存储设计第34-39页
     ·林产品数据及网站特征数据存储第34-37页
     ·待抓取产品链接数据第37-38页
     ·林产品详细信息第38-39页
   ·信息获取程序流程第39-40页
   ·功能实现第40-46页
     ·网站特征的增加和修改第40-41页
     ·供应/求购链接的定位第41-42页
     ·分类链接/产品列表链接的定位第42-43页
     ·具有两级分类结构的网站产品信息获取第43-44页
     ·分类结构混乱/无分类结构网站产品信息获取第44页
     ·产品链接存储以及待抓取链接文件的生成第44-46页
     ·抓取过程及对链接文件的处理第46页
     ·林产品信息的存储第46页
   ·关键问题及解决方案第46-47页
     ·多线程抓取第46-47页
     ·信息质量保障第47页
   ·结果分析第47-49页
     ·运行效率第48页
     ·信息质量第48-49页
5 结论第49-51页
参考文献第51-55页
个人简介第55-56页
导师简介第56-57页
获得成果目录第57-58页
致谢第58页

论文共58页,点击 下载论文
上一篇:林分生长收获模拟系统的关键技术研究与系统研建
下一篇:林产品贸易信息推送的文本信息过滤技术的研究