解析国家药监局化妆品公司许可信息 - 代码天地

解析国家药监局化妆品公司许可信息

其他 2020-04-03 10:34:16 阅读次数: 0

所谓掌握了requests库就等于掌握了爬虫的半壁江山
所以本例选用requests库

之所以拿“国药监”网站来进行学习是因为，我们要获取的数据均是post请求且采取Ajax的方式在页面间传递，还在于我们要解析的数据需要两次请求，所以这就很考研对问的深究能力，综合性一般
据分析可以得出，我们在第一次请求的时候要拿的是，公司数据对应的id
第二次我们根据id去请求相应的数据
需要注意的是，我们所得到的是json类型
在本例的最后，可以对已经获取的数据进行分析，得到自己想要的数据
因本例的学习性质，所以不再将数据进行分析

#!/usr/bin/env python
# encoding: utf-8

"""
@file: 国家药监局化妆品公司许可信息.py
@time: 2020/2/23 21:58
"""

import requests


def post_GY():
    # 批量获取企业id
    url = "http://125.35.6.84:81/xk/itownet/portalAction.do?method=getXkzsList"
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) '
                      'Chrome/80.0.3987.116 Safari/537.36'
    }

    id_list = []  # 暂存企业id
    word = int(input('请输入想要爬取的页数：'))
    for page in range(1, word + 1):
        page = str(page)
        data = {
            'on': 'true',
            'page': page,
            'pageSize': '15',
            'productName': '',
            'conditionType': '1',
            'applyname': '',
            'applysn': ''
        }

        json_ids = requests.post(url=url, data=data, headers=headers).json()
        for dic in json_ids['list']:
            id_list.append(dic['ID'])

    # 获取企业详情数据
    post_url = 'http://125.35.6.84:81/xk/itownet/portalAction.do?method=getXkzsById'
    for id in id_list:
        dat_id = {
            'id': id
        }
        detail_json = requests.post(url=post_url, data=data_id, headers=headers).json()
        print(detail_json)
    print('解析完成!')


if __name__ == '__main__':
    post_GY()

未经允许不得擅用

黑夜中的潜行者

发布了48 篇原创文章 · 获赞 55 · 访问量 4491

私信关注

猜你喜欢

转载自blog.csdn.net/qq_43562262/article/details/104463156

解析国家药监局化妆品公司许可信息

python爬虫学习（五）药监局化妆品生产许可

爬虫练习项目--化妆品生产许可信息管理系统服务平台

爬取NMPA化妆品生产许可信息数据，保存到excel中（requests初体验）

Python爬取国家药监总局化妆品详细信息

化妆品Cosmetics

业务：某化妆品公司商业模式

Python爬取CFDA化妆品生产信息

requests爬取国家药监总局中基于中华人民共和国化妆品生产许可证相关数据

1-6 requests模块之爬取化妆品生产许可证

日本化妆品公司佳丽宝宣布召回54种产品

食疗排除化妆品的铅汞毒

django 王中王5之化妆品

化妆笔记丨1 化妆品概说

springboot化妆品网上商城含后台管理java化妆品商城源码

电子签名电子合同获肯定国家药监局：推动疫苗生产检验电子化

护肤品和化妆品的意大利文表达

畅销全球30年的经典化妆品

老中医化妆品是品牌吗

化妆品生产追溯系统，让女神放心美丽

化妆品追溯管理系统开发

化妆品区块链溯源，守护你的美

jsp ssh日韩化妆品商城购物系统

解析消费增值---为化妆品行业增新高

[小程序模板] 化妆品商城小程序模板商城APP模板化妆品商城小程序前端源码+免费分享

《2023年化妆品原料成分趋势报告》| 解码化妆品备案数据，洞悉2023年潜力原料成分

四：后台数据库设计（化妆品表格）

按压式化妆品护发素瓶子包装Vi样机贴图教程

伽蓝集团郑春颖：以化妆品业为突破口助推“上海购物”

褚时健走了，他的思想给了化妆品生产管理者哪些启发？

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)