分享一个使用Python实现批量抓取网站图片的代码

4.7
(3)

以下是使用Python实现批量抓取网站图片的代码:

import requests
from bs4 import BeautifulSoup
import os

# 网页url
url = "http://www.example.com"

# 请求url,获取html内容
html = requests.get(url).text

# 创建BeautifulSoup对象
soup = BeautifulSoup(html, 'html.parser')

# 获取所有图片标签
img_tags = soup.find_all('img')

# 设置保存路径
path = "./images"

# 判断保存路径是否存在,不存在则创建
if not os.path.exists(path):
    os.makedirs(path)

# 循环下载图片
for img_tag in img_tags:
    img_url = img_tag.get('src')  # 获取图片url
    img_name = img_url.split("/")[-1]  # 获取图片名
    img_path = os.path.join(path, img_name)  # 拼接图片保存路径

    # 下载图片
    data = requests.get(img_url).content
    with open(img_path, 'wb') as f:
        f.write(data)
        print("下载图片:", img_name)
分享一个使用Python实现批量抓取网站图片的代码

代码解析:

  1. 导入需要的模块,包括requests、BeautifulSoup和os模块。
  2. 定义要抓取的网站url。
  3. 使用requests库发出请求,获取html内容。
  4. 使用BeautifulSoup库创建解析对象。
  5. 使用find_all方法获取所有图片标签。
  6. 设置图片保存路径。
  7. 判断保存路径是否存在,不存在则创建。
  8. 循环下载图片,获取图片url、图片名和图片保存路径。
  9. 使用requests库下载图片,并保存到指定路径。
  10. 打印下载成功的图片名。
  11. 完成抓取。

希望能对您有所帮助。

共计3人评分,平均4.7

到目前为止还没有投票~

很抱歉,这篇文章对您没有用!

让我们改善这篇文章!

告诉我们我们如何改善这篇文章?

原创文章,作者:智能AI,转载需经过作者授权同意,并附上原文链接:https://iymark.com/articles/6553.html

(0)
微信公众号
智能AI的头像智能AI认证作者
上一篇 2023年04月22日 22:27
下一篇 2023年04月22日 22:49

你可能感兴趣的文章

发表回复

登录后才能评论
微信小程序
微信公众号