全栈一（爬虫） - 代码天地

全栈一（爬虫）

其他 2021-03-23 09:51:30 阅读次数: 0

// 爬虫 
const http = require('http'); //导入模块
const fs = require('fs');
// 分析网址的第三方模块
const cheerio = require('cheerio');
// let str = 'https://nodejs.org/dist/index.json'; //访问对象的url地址
let str = 'http://www.4399.com/';
//get请求 获取目标王者
http.get(str, (res) => {
    
    

  //获取响应的状态码
  const {
    
     statusCode } = res;
  //设置响应的内容类型
  const contentType = res.headers['content-type'];

//   处理错误
  let error;
  // 任何 2xx 状态码都表示成功的响应，但是这里只检查 200。
  if (statusCode !== 200) {
    
    
    error = new Error('请求失败\n' +
                      `状态码: ${
      
      statusCode}`);
  } else if (!/^text\/html/.test(contentType)) {
    
    
    error = new Error('无效的 content-type.\n' +
                      `期望的是 application/json 但接收到的是 ${
      
      contentType}`);
  }
  if (error) {
    
    
    console.error(error.message);
    // 消费响应的数据来释放内存。
    res.resume();
    return;

  }

//设置字符集
    res.setEncoding('utf8');
    let rawData = ''; //存储获取到的数据
    //监听了一个 数据流 事件
    res.on('data', (chunk) => {
    
     
      rawData += chunk; 
    });
    //监听了一个 结束的 事件
    res.on('end', () => {
    
    
        console.log(rawData);
        $ = cheerio.load(rawData); //加载html，返回jQuery对象
        $('a').each(function(){
    
    
            fs.appendFileSync('./a.txt',$(this).attr('href') + '\n');
        })
       fs.writeFile('./4399.html',rawData,(err)=>{
    
    
           if(!err){
    
    
               console.log('爬取成功');
           }
       })
      
    });
});

猜你喜欢

转载自blog.csdn.net/qq_52151772/article/details/115051540

全栈一（爬虫）

全栈试卷一

全栈一（express）

Java 全栈体系（一）

马哥python全栈+爬虫+高端自动化

Flutter 全栈开发体验——爬虫与服务端

走在JS上的全栈之路(一)

一次全栈实践心得

NDN全栈： ndnsim (一)：背景

全栈最后一公里

Python全栈•前端(一)-HTML

【043】Python全栈日记-Linux（一）

【047】Python全栈日记-Django（一）

Go全栈学习（一）基础语法

django全栈(一):前后端技术栈简析

全栈

五年Python爬虫程序员整理的全栈爬虫知识点

全栈视角：基于 Node 做一个全栈租房应用

python全栈学习之路（一）Linux基础（一）

马哥Python全栈+爬虫+高端自动化课程

爬虫系列---scrapy post请求、框架组件和全栈爬取

最新Python全栈开发+爬虫+自动化开发项目实战(完整)

Python全栈开发+爬虫工程师+自动化开发就业班教程

全栈式的Java开发框架JHipster简介（一）

物联网全栈教程-从云端到设备（一）

Python全栈修炼日记之一：编程语言的介绍

pthon全栈第一课

python全栈开发学习模块一（笔记5）

python全栈开发学习模块一（笔记4）

记一次全栈项目学习经历

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)