node js简单爬取网页图片 - 代码天地

node js简单爬取网页图片

编程语言 2023-07-18 19:07:31 阅读次数: 0

```handlebars
/**
 * 请求网站实例
 * 将数据保存本地文件
 */

const http = require('https');
const fs = require('fs');
const cheerio = require('cheerio');

let url = 'https://www.csdn.net/';

http.get(url, (res) => {
    
    
    //安全判断
    const {
    
     statusCode } = res; //状态码
    const contentType = res.headers['content-type']; //文件类型
    console.log(statusCode, contentType);

    let err = null;
    if (statusCode !== 200) {
    
    
        err = new Error('请求状态错误')
    } else if (!/^text\/html/.test(contentType)) {
    
    
        // 格式内容是网页
        err = new Error('请求类型错误')

    }
    if (err) {
    
    
        console.log(err);
        res.resume(); //重置缓存
        return false;
    }
    // 数据分段，只要接收数据就会触发data事件， chuck  每次接收的数据片段
    let rawData = '';
    res.on('data', (chuck) => {
    
    
            console.log("----");
            rawData += chuck.toString('utf8');

        })
        // 数据流传输完毕
    res.on('end', (chuck) => {
    
    
        console.log("数据传输完毕")
            // 将请求的数据保存到本地
        fs.writeFileSync('./bibi.html', rawData);
        // 通过cheerio分析
        let $ = cheerio.load(rawData); //将请求的网页进行转化
        $('img').each((index, el) => {
    
    
            console.log($(el).attr('src'))
        })
    })
}).on('error', (err) => {
    
    
    console.log(err)
})

爬取效果图：

![在这里插入图片描述](https://img-blog.csdnimg.cn/0a765eea2bd848b0b6806e49830b8850.png)

猜你喜欢

转载自blog.csdn.net/weixin_45932157/article/details/130998864

node js简单爬取网页图片

node：爬虫爬取网页图片

Node实战-----爬取网页图片

Node爬虫：利用Node.js爬取网页图片的实用指南

Node.js实现简单的爬取

node.js 爬虫实现爬取网页图片并保存到本地

Node JS爬虫：爬取瀑布流网页高清图

【快速上手】用Node.js做简单的图片爬取

node爬取网站图片

【node】用node爬取网页图片，并创建目录将爬取的图片存储到目录中，附带源码

node.js实战：爬取网站图片并下载保存

用Node.js爬取图片的踩坑日志

利用Node.js爬取简单页面数据

node实现网页内容的爬取

node轻松实现网页爬取功能

node 爬取图片并下载到本地

node爬虫系列（一）爬取静态网页图片链接并下载

Node.js 薄荷网爬取

node js 爬虫爬取静态页面，

用Node.js爬取动态网页，这可能是最简洁的方式

node爬取html乱码

Node.js爬取妹子图-async的使用

Node.js爬取妹子图-crawler爬虫的使用

Node.js爬取十九大报告标题链接

使用node.js如何爬取网站数据

node.js爬取数据并定时发送HTML邮件

node.js爬取数据(实操)

Node.js 爬虫爬取电影信息

Node.js爬取百度图片之解析objURL外加随手写个瀑布流

node js

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)