为了找一份Python实习，我用爬虫收集数据 - 代码天地

为了找一份Python实习，我用爬虫收集数据

其他 2019-01-22 11:53:33 阅读次数: 0

张世润，知乎专栏：https://zhuanlan.zhihu.com/p/26409764

记录下爬取招聘网站上Python实习信息，为了找实习做好准备。

==============================================

环境准备：

Python3.5

PyCharm

fake_useragent

实习僧还是挺不错的网站，打开http://www.shixiseng.com/interns?k=Python

打算把职位名称、地点、公司、薪水和职位的URL爬取并保存下来

本人对于Python学习创建了一个小小的学习圈子，为各位提供了一个平台，大家一起来讨论学习Python。欢迎各位到来Python学习群：960410445一起讨论视频分享学习。Python是未来的发展方向，正在挑战我们的分析能力及对世界的认知方式，因此，我们与时俱进，迎接变化，并不断的成长，掌握Python核心技术，才是掌握真正的价值所在。

对页面简单分析，发现需要三步爬取所需信息。

1、爬取搜索页面的职位、地点、公司、薪水

用到的工具是requests加xpath，直接上代码

job，location，company，salary，link都是list，方便接下来的文件写入

网页只有9页，每一页有10条职位信息，一共90个职位。

可以使用print打印出来看看，结果对不对

fake-useragent是一个可以伪造浏览器头的库，非常好用：https://github.com/hellysmile/fake-useragent

用法：

2、爬取职位详细页面的信息

打开第一个职位页面 http://www.shixiseng.com/intern/inn_geghnqp8j3oz

发现所有的描述都在class="dec_content"的div标签下，原本是想使用xpath解析，但是发现了一个问题，某些职位描述是在<span>标签下，某些是在<p>标签下

最后选择BeautifulSoup来解决问题

3、将所爬到的信息保存下来

使用xlwt来保存到excel文件中

.

最后的结果：

猜你喜欢

转载自blog.csdn.net/qq_40925239/article/details/86574142

为了找一份Python实习，我用爬虫收集数据

python收集数据

我用这五本电子书告诉你小白如何自学Python找一份月薪13k的工作

用流收集数据

「历时6个月招聘数据收集」一份Python招聘分析报告

友情提示，你该找一份假期实习啦！

一份Python爬虫电子书

找实习心得（Python爬虫）

因为 MongoDB 没入门，我丢了一份实习工作

我的第一份实习—ISP图像调试工程师

Python爬虫+BI分析，我做了一份酷炫的A股牛市可视化！

python：全网独一份的数据分析视频教程资源，我准备好了

我的第一份工作

我的第一份博客

一份升华自我的书单

java web第一份实习工作

ZZULIOJ 2348: 小明的第一份实习任务

软件工程第一份实习工作

我的2018，用一年的时间写一份年终总结！

拙见：怎么找一份好工作

找一份好的前端工作，起点很重要

突然想回家找一份工作

Python网络爬虫入门-进阶项目练习题《写出来私我有奖，学习大礼包一份》

收集数据

表单 - 收集数据

Python爬虫完整代码，一人一份，随便拿~

java8实战五:用流收集数据

Java 8 学习笔记6——用流收集数据

Java8用流收集数据

幸好有你，一份 Python3 爬虫教程！

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)