Python爬去知乎上问题下所有图片 - 代码天地

Python爬去知乎上问题下所有图片

其他 2018-08-08 12:10:01 阅读次数: 0

from zhihu_oauth import ZhihuClient
from zhihu_oauth.exception import NeedCaptchaException

client = ZhihuClient()

try:
    client.login('email_or_phone', 'password')
    print(u"登陆成功!")
except NeedCaptchaException:
    # 保存验证码并提示输入，重新登录
    with open('a.gif', 'wb') as f:
        f.write(client.get_captcha())
    captcha = input('please input captcha:')
    client.login('+8613872273541', 'z289784552', captcha)
    print(u"登陆成功!")
client.save_token('token.pkl')

获取Token

from __future__ import print_function # 使用python3的print方法
from zhihu_oauth import ZhihuClient
import re
import os
import urllib.request

client = ZhihuClient()
# 登录
client.load_token('token.pkl')  # 加载token文件
id = 46508954 # https://www.zhihu.com/question/24400664(长得好看是一种怎么样的体验)
question = client.question(id)
print(u"问题:",question.title)
print(u"回答数量:",question.answer_count)
os.mkdir(question.title + u"(图片)")
path = question.title + u"(图片)"
index = 1 # 图片序号
for answer in question.answers:
    content = answer.content  # 回答内容
    re_compile = re.compile(r'<img src="(https://pic\d\.zhimg\.com/.*?\.(jpg|png))".*?>')
    img_lists = re.findall(re_compile, content)
    if (img_lists):
        for img in img_lists:
            img_url = img[0]  # 图片url
            urllib.request.urlretrieve(img_url, path + u"/%d.jpg" % index)
            print(u"成功保存第%d张图片" % index)
            index += 1

加载Token并读取数据

猜你喜欢

转载自www.cnblogs.com/wuyujie/p/9441927.html

Python爬去知乎上问题下所有图片

Python爬虫对知乎问题下的图片进行爬取

[Python 爬虫之路4] 使用selenium爬取知乎任意一个问题下，所有回答中的图片

用于爬取知乎某个话题下的精华问题中所有回答的爬虫

Python项目实战:实现简单爬取知乎问题下的图片

Python爬取知乎单个问题下的回答

Python爬取知乎上的图片

根据关键词组合，爬取知乎某个问题下所有含有关键词的回答

python实战1.0——爬取知乎某问题下的回复

Scrapy爬取知乎所有问题和回答

python爬取知乎话题："日常穿jk制服是怎样一种体验？"下的所有图片

Python爬虫从入门到放弃（十八）之 Scrapy爬取所有知乎用户信息(上)

知乎问题图片爬取

python 爬取知乎图片

爬去知乎分析

Python下载知乎单独答案的图片和所有答案的图片

Python爬虫爬取网页上的所有图片

Python爬虫从入门到放弃（十九）之 Scrapy爬取所有知乎用户信息(下)

python：知乎发现页的爬取（问题，作者，回答）

Python爬虫抓取知乎所有用户信息

知乎问答图片爬取

利用selenium爬取知乎图片

使用scrapy爬取知乎图片

python爬虫知识点总结（二十四）Scrapy爬去知乎用户信息

Python爬虫--爬取知乎

Python爬取知乎文章（一）

用python爬取知乎问答

【python爬虫自学笔记】-----爬取知乎图片并保存在本地

python爬虫实战（一）--爬取知乎话题图片

使用python爬虫——爬取淘宝图片和知乎内容

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)