scrapy-redis 的工作流程-千锋教育

校区

首页课程师资教程资讯关于

校区精品课程

互联网前瞻热门课程从入门到成神

鸿蒙生态开发 HTML5培训 Java培训 Python培训云计算培训软件测试培训网络安全培训大数据培训物联网培训 Unity培训全媒体营销培训影视剪辑培训游戏原画培训区块链培训商业插画培训产品经理培训

全国旗舰校区

不同学习城市同样授课品质

北京

深圳

上海

广州

郑州

大连

武汉

成都

西安

杭州

青岛

重庆

长沙

哈尔滨

南京

太原

沈阳

合肥

贵阳

济南

下一个校区
就在你家门口 +

培训课程
师资团队
关于千锋

培训机构
面试题
就业前景

零基础学IT

当前位置：首页 > 技术干货

scrapy-redis 的工作流程

发布时间:2022-09-07 17:39:42

发布人:syq

　　master端通过redis进行网址的去重，进行任务的调度，slave端争夺任务开始爬取，并将爬取的数据交回master端。

　　第一：爬虫指定好redis_key，启动，等待起始url。

　　第二：运行脚本，往redis_key中填充start_urls

　　第三：爬虫发现redis_key中有了start_urls，开始取出这些url

　　第四：爬虫按照默认参数，将这些url打包生成requests

　　第五：将这些requests送往scheduler调度模块，进入等待队列，等待调度。

　　第六：scheduler模块开始调度这些requests，出队，发往爬虫引擎。

　　第七：爬虫引擎将这些requests送到下载中间件(多个，例如加header，代理，自定义等等)进行处理。

　　第八：处理完之后，送往Downloader模块进行下载。

上一篇软件测试之断言以及常见的webui自动化框架是什么

下一篇Flask中请求上下文和应用上下文的区别和作用

相关文章

什么项目适合使用Scrum?

什么项目适合使用Scrum?

scrum敏捷软件开发是什么?

scrum敏捷软件开发是什么?

敏捷BI和传统BI有什么区别?

敏捷BI和传统BI有什么区别?

敏捷开发实行中各岗位职能是什么?

敏捷开发实行中各岗位职能是什么?

最新文章

常见网络安全面试题:Windows常用的命令有哪些？

常见网络安全面试题:Windows常用的命令有哪些？

常见网络安全面试题:根据设备告警如何展开排查？

常见网络安全面试题:根据设备告警如何展开排查？

常见网络安全面试题:mysql加固呢？（数据库加固）

常见网络安全面试题:mysql加固呢？（数据库加固）

常见网络安全面试题:windows和linux加固？（操作系统加固）

常见网络安全面试题:windows和linux加固？（操作系统加固）

热门频道

IT培训机构

培训费用、培训周期你关心的都有

就业前景

学会能干什么，IT培训就业前景介绍

零基础学习

零基础学习IT，大神也是零基础起步

面试题

常见经典面试题及答案解析

千锋问问

搜集常见技术关键点，高效答疑

网站地图

明晰网站布局，快速定位学习内容

在线咨询免费试学教程领取