pyquery爬取知乎发现 - 代码天地

pyquery爬取知乎发现

其他 2018-07-03 12:13:37 阅读次数: 0

import requests
from pyquery import PyQuery as pq
url = 'https://www.zhihu.com/explore'
headers = {'User-Agent' : '*******'}
html = requests.get(url, headers=headers).text
doc = pq(html)
items = doc('.explore-feed.feed-item').items()
for item in items:
question = item.find('h2').text()
author = item.find('.author-link').text()
answer = pq(item.find('.content').html()).text()
file = open('explore.txt', 'a', encoding='utf-8')
file.write('\n'.join([question, author, answer]))
file.write('\n' + '='*50 + '\n')

file.close()

是的，崔大佬书上的例子，但是因为知乎更改网页标题，所以其中有更改。

answer = pq(item.find('.content').html()).text()

此句是提取完整回答是个动态，还不懂。以后回来补上。。

这里.html（）其实是返回网页模块。认真看了一下。这个class=content的网页标签里面就是回答的全部。但是里面有html的格式。所以崔大佬在这里应该是返回回答的完整内容，再用一个pq初始化，直接提取内容，而将文字格式丢弃。

猜你喜欢

转载自blog.csdn.net/ynztwlz/article/details/80795192

pyquery爬取知乎发现

requests + pyquery爬取知乎发现首页

解析库的使用[爬取知乎发现]

python：知乎发现页的爬取（问题，作者，回答）

N0.4——用pyquery解析库爬取知乎explore页面

python爬虫：requests+pyquery实现知乎热门话题爬取

知乎live爬取

scrapy爬取知乎

爬虫爬取知乎的话题

Scrapy 爬取知乎用户信息

Scrapy爬取知乎用户信息

知乎问题图片爬取

知乎用户爬取学习

Python爬虫--爬取知乎

Scrapy框架：爬取知乎

Python爬取知乎上的图片

Python爬取知乎文章（一）

scrapy爬取知乎问答

基于 webmagic 的知乎爬取[GitHub]

简单爬取知乎网的问答

用python爬取知乎问答

python 爬取知乎图片

知乎问答图片爬取

爬取知乎用户信息

爬取每则知乎日报

爬取知乎热榜

利用selenium爬取知乎图片

使用scrapy爬取知乎图片

利用正则表达式和Request库爬取知乎发现页面的标题部分

Python爬取知乎专栏文章标题及URL

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)