node.js实战：爬取网站图片并下载保存 - 代码天地

node.js实战：爬取网站图片并下载保存

其他 2020-01-22 22:31:03 阅读次数: 0

前言：
早就对node.js的爬虫“倾慕已久”，兜兜转转两三个月，又接触到了node.js。

话不多说，直接上代码

npm install request cheerio

const request = require('request')
const fs = require('fs')
const cheerio = require('cheerio')
request('http://cjxnsb.cn/mxc/UCgzs/1.html', function (error, response, body) {
    console.log('error:', error); // 错误优先
    console.log('statusCode:', response && response.statusCode);
    //获取爬取网站的页面信息
    const $ = cheerio.load(body)
    let imgs = []
    //目标网站图片链接地址数组
    // 用正则判断数组中的路径是否存在https
    var _ = /(http[s]?|ftp)/;
    $('img').each((i, e) => {  // 遍历所有
        var src = $(e).attr('src');

        if (!_.test(src)) {
            src = src.replace(/\/{2}/, 'https://')   //因为有些图片不可下载，所以用正则判断一下
        }
        imgs.push(src)
    })
    // 下载数组里的图片
    for (let index = 0; index < imgs.length; index++) {
        if (imgs[index].indexOf('http') !== -1) {
            request(imgs[index]).pipe(fs.createWriteStream(`./img/${index}.png`)) //这里为了省事，我就直接用下标命名了；
        }
    }
});

有几处需要注意的地方：

本demo只能爬取https网页图片，需要http的可以稍加改动
cheerio：可以操作dom块，同jQuery写法
一定要提前新建img文件夹（图片保存路径），否则会出错！

本文仅供学习使用！

云风清

发布了195 篇原创文章 · 获赞 391 · 访问量 5万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_43624878/article/details/103486732

node.js实战：爬取网站图片并下载保存

node.js 爬虫实现爬取网页图片并保存到本地

使用node.js如何爬取网站数据

用Node.js爬取图片的踩坑日志

node爬取网站图片

Node.js 薄荷网爬取

Node.js实现简单的爬取

Node爬虫：利用Node.js爬取网页图片的实用指南

使用node.js爬网站图

Node.js 上传图片并保存

【快速上手】用Node.js做简单的图片爬取

Node实战-----爬取网页图片

node 爬取图片并下载到本地

node js简单爬取网页图片

爬取网站图片，并下载保存到指定文件夹

node.js爬虫批量下载图片

Node.js爬取妹子图-async的使用

Node.js爬取妹子图-crawler爬虫的使用

Node.js爬取十九大报告标题链接

node.js爬取数据并定时发送HTML邮件

node.js爬取数据(实操)

利用Node.js爬取简单页面数据

Node.js 爬虫爬取电影信息

手把手教你用Node.js爬虫爬取网站数据

Node.js爬取科技新闻网站cnBeta（附前端及服务端源码）

Node.js爬取百度图片之解析objURL外加随手写个瀑布流

网络爬虫（爬取网站图片，自动保存本地）

python爬取网站上的图片并保存到本地

利用Jsoup爬取网站的图片，保存到本地

python爬虫爬取网站图片保存本地

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)