爬虫代码1 - 代码天地

爬虫代码1

其他 2018-08-30 21:24:28 阅读次数: 0

#CrawUnivRankingB.py
import requests
from bs4 import BeautifulSoup
import bs4
def getHTMLText(url):
try:
r = requests.get(url, timeout=30)
r.raise_for_status()
r.encoding = r.apparent_encoding
return r.text
except:
return ""
def fillUnivList(ulist, html):
soup = BeautifulSoup(html, "html.parser")
for tr in soup.find('tbody').children:
if isinstance(tr, bs4.element.Tag):
tds = tr('td')
ulist.append([tds[0].string, tds[1].string, tds[3].string])
def printUnivList(ulist, num):
tplt = "{0:^10}\t{1:{3}^10}\t{2:^10}"
print(tplt.format("排名","学校名称","总分",chr(12288)))
for i in range(num):
u=ulist[i]
print(tplt.format(u[0],u[1],u[2],chr(12288)))
def main():
uinfo = []
url = 'https://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html'
html = getHTMLText(url)
fillUnivList(uinfo, html)
printUnivList(uinfo, 20) # 20 univs
main()

猜你喜欢

转载自blog.csdn.net/dongdong0071/article/details/78896811

爬虫代码（1）

爬虫代码1

Python网络爬虫(1)——Requests及爬虫通用代码框架

爬虫（1）——爬虫前奏

爬虫1

爬虫（1）

爬虫（１）

爬虫(1)

爬虫--1

爬虫-1

使用postman一键生成你的爬虫代码（postman在爬虫中的应用）1

爬虫之路（1）：认识爬虫

爬虫开发.1爬虫介绍

python爬虫1 - 爬虫概要

爬虫开发_爬虫概述（1）

(转)Python新手写出漂亮的爬虫代码1——从html获取信息

Java实现网络爬虫案例代码1：获取天气预报信息

1行Python代码下载图片，爬虫从未如此简单，百度看了都害怕

1行Python代码下载图片，爬虫从未如此简单，某度看了都害怕

爬虫简单基础代码

爬虫----代码段总结

学习笔记——爬虫（代码）

Python爬虫代码框架

Google图片爬虫代码

爬虫-通用代码框架

python爬虫完整代码

python 爬虫代码：

爬虫(4)_代码分析

爬虫代码框架

爬虫代码开始：

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)