全国旗舰校区

不同学习城市 同样授课品质

北京

深圳

上海

广州

郑州

大连

武汉

成都

西安

杭州

青岛

重庆

长沙

哈尔滨

南京

太原

沈阳

合肥

贵阳

济南

下一个校区
就在你家门口
+
当前位置:首页  >  技术干货

教你用Python爬取街拍美女图片(超详细附源码)

发布时间:2021-01-05 10:50:00
发布人:小千

今天小千来发福利了,教大家如何从网上爬取美女街拍图片,然后批量插入到word里面,没事的时候可以拿出来养养眼不是,看下去文末附源码获取方式:

本文涉及知识主要包括Ajax动态加载网页爬取、requests保存网页图片以及word批量插入图片。

第一步:分析图片数据接口打开今日头条主页,搜索街拍,会出现好多街拍图片

1

一直往下拉,图片会一直加载,但是网页url未变化,这时我们要打开流量分析工具。以火狐浏览器为例,依次右键-查看元素-网络,然后点击左上角清除按钮

2

下拉网页:

3

出现一大堆加载数据,这时我们打开第一个的json文件的响应窗口:

4

发现这返回的就是街拍图片信息,每次返回20条,再看看它的请求参数:

5

经过试验发现,timestamp和_signature是变化参数,但是可以舍弃,最后以offset的变化来改变换页(0代表第1页,20代表第2页,依次类推...)

第二步:python下载图片准备下载20页的数据

1.首先构造url

6

2.模拟请求数据,并将返回数据转换成json格式

7

一定要带上登录后的cookie数据,否则无法返回图片信息

3.从返回数据中取出标题和图片url

8

4.requests下载图片,并以标题命名

9

5.图片效果展示

10

第三步:word批量插入图片安装docx和PIL模块,直接pip安装即可

1.导入相关模块

11

2.遍历该文件夹下所有图片名

12

3.获取每张图片像素大小

13

主要是因为街拍图片像素差别较大,想按原像素大小导入word中,img.size为元组类型数据,这里用list将其转化为列表

4.将图片按原像素添加至word中

14

5.最终效果

15

看完了,是不是想试一试了,想要源码的同学可以添加我们的Python技术交流qq群:790693323,加群找群管理要学习资料和项目代码即可,还在等什么,等你来哦~~~~

相关文章

服务器最大内存是多少,制约因素有些什么?

服务器最大内存是多少,制约因素有些什么?

2023-10-14
USB Type C电缆正反插都可以?

USB Type C电缆正反插都可以?

2023-10-14
EditorConfig的作用是什么?

EditorConfig的作用是什么?

2023-10-14
Call Stack(调用栈)是什么?

Call Stack(调用栈)是什么?

2023-10-14

最新文章

常见网络安全面试题:Windows常用的命令有哪些?

常见网络安全面试题:Windows常用的命令有哪些?

2023-10-09
常见网络安全面试题:根据设备告警如何展开排查?

常见网络安全面试题:根据设备告警如何展开排查?

2023-10-09
常见网络安全面试题:mysql加固呢?(数据库加固)

常见网络安全面试题:mysql加固呢?(数据库加固)

2023-10-09
常见网络安全面试题:windows和linux加固?(操作系统加固)

常见网络安全面试题:windows和linux加固?(操作系统加固)

2023-10-09
在线咨询 免费试学 教程领取