开始入门爬虫（1） - 代码天地

开始入门爬虫（1）

其他 2019-02-28 23:17:59 阅读次数: 0

import requests
from bs4 import BeautifulSoup
import bs4
url="http://www.zuihaodaxue.com/zuihaodaxuepaiming2016.html"
data=requests.get(url)
ulist=[]
data.encoding=data.apparent_encoding
soup=BeautifulSoup(data.text,"html.parser")
for ff in soup.find('tbody').children:
    if isinstance(ff,bs4.element.Tag): #这个判断条件必不可少，少了会编译出现错误
       tds=ff('td')#这里是将ff标签下所有的td标签找到
       
       
    ulist.append([tds[0].string,tds[1].string,tds[2].string,tds[3].string,tds[4].string,tds[5].string])
for u in range(100):
    print(ulist[u])#直接打印出来

　参照mooc上面北京理工大学的教程，爬去中国大学排名，我就直接写了，不写函数了。这个很简单，主要就是按照html文本的标签树一直找下来就可以了。

猜你喜欢

转载自www.cnblogs.com/illfuckingkyzb/p/10453810.html

开始入门爬虫（1）

Flask 1（开始入门）

网络爬虫入门（1）

python爬虫入门（1）

爬虫入门（1）

爬虫入门-1

opengl 开始入门杂记1

1，爬虫入门之爬虫基础了解

爬虫入门1---谈谈网络爬虫

一个菜鸟python网络爬虫入门学习记录——从爬取网站图片开始学习python（1）

爬虫入门教程 —— 1

python的爬虫入门学习1

python爬虫入门训练-1

爬虫入门（1）--糗百

Python爬虫入门1：序章

爬虫开始

Python爬虫从入门到精通——爬虫基础：爬虫的基本原理，从零开始学！

【Spring从入门到出家】1 - 从IOC开始

从0开始学爬虫（1）—— 配置工作环境

Python爬虫入门 | 1 Python环境的安装

Python爬虫入门 1 Python环境的安装

【爬虫入门1】css选择器

Python 爬虫入门笔记1(for myself)

网络爬虫之Request库入门（1）

Python爬虫入门【1】： CentOS环境安装

Python爬虫笔记1 | request库入门

入门Python爬虫Day1

爬虫编程入门实践（Day 1）

Python爬虫入门学习-起因（1）

爬虫从入门到放弃——WebMagic使用简单的爬虫（1）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)