Python爬取个人所有Codeforces比赛每个时间段内出题情况 - 代码天地

Python爬取个人所有Codeforces比赛每个时间段内出题情况

其他 2019-04-18 01:37:50 阅读次数: 0

版权声明：欢迎转载，请注明此博客地址。 https://blog.csdn.net/Ever_glow/article/details/85326701

工具：PyChram

分析：由个人页面可以得到个人最近的比赛的数据

检查元素发现可以利用Rank排名得到每个人在每场比赛中的排名，状态如下：

检查元素中，容易发现有特定id，并且时高亮显示，但千万不要利用高亮显示，高亮显示是后台渲染的，所以可以利用专属id，而且专有id可以在上个页面中爬取。

利用bs4得到所有id为专属项目的tr，然后得到每一个时间的td，切割出时间，直接字符串比较。把时间分成n个时间段，然后得到y坐标。最后输出（x，y）的坐标系。

代码实现：

import pylab
import requests
import numpy
import re
import xlwt
import urllib
import bs4
url = "http://codeforces.com/contests/with/passer__"
str1 = requests.get(url).text
aim = r'/contest/.*/standings/.*/.*'
a = re.compile(aim)
li = a.findall(str1)

#case 1 00:00-00:12
#case 2 00:13-00;43
#case 3 00:44-01;40
#case 4 01:41-01-50
#case 5 01:51-01:55
#case 6 01;56-
x = [1,2,3,4,5,6]
y = [0,0,0,0,0,0]

for i in li:
    i = i[:-1]
    i = i[:-2]
    ss_id = i[-18:-10]
    url = "http://codeforces.com"+i
    str2 = requests.get(url).text
    bs = bs4.BeautifulSoup(str2,'lxml')
    soul = bs.find_all('tr',participantid=ss_id)
    temp = str(soul)
    now = r'<span class="cell-time">(\d*:\d*)'
    aim_now = re.compile(now)
    li_now = aim_now.findall(temp)
    for j in li_now:
        if str(j) <= "00:12":
            y[0] += 1
        elif str(j) <= "00:43":
            y[1] += 1
        elif str(j) <= "01:41":
            y[2] += 1
        elif str(j) <= "01:50":
            y[3] += 1
        elif str(j) <= "01:55":
            y[4] += 1
        else:
            y[5] += 1

pylab.plot(x,y)
pylab.show()

结果如下：

这就是菜鸡选手的做题曲线，前1小时做做水题，最后运气好能憋出几个。哎。。。。。

猜你喜欢

转载自blog.csdn.net/Ever_glow/article/details/85326701

Python爬取个人所有Codeforces比赛每个时间段内出题情况

python爬取codeforces比赛题目

sql获取时间段内的所有日期

mysql查询时间段的所有数据

获取某个时间段内所有月份

java获取时间段内所有季度

SQL 时间段处理（时间段筛选，时间段取交集，时间段合并，拆分）

Java中传入一个时间段，取出该时间段内所有日期的集合

爬取股吧指定时间段的文章标题

oracle取某时间段的数据

从一段时间段中获取所有日期

python3爬取CSDN个人所有文章列表页

python爬取所有股票报道

python爬取HDU所有题目

Python爬取网页所有小说

sql查询两个时间段是否有交集的情况

Python时间序列--时间段（一）

Oracle 查询两个时间段内的所有日期列表

Oracle查询任意时间段内的所有日期,无需建表

sql 取得某个时间段内的所有月份和日期

Java中查询某个日期下所有时间段的数据

获取两个时间段内所有日期

获取某时间段内所有的年月日

JAVA 获取某个时间段内所有的日期

获取时间段内的所有月份yyyy-MM

java获取时间段内的所有星期一

获取两个时间段中间所有日期，工具类

mysql获取给定时间段内的所有日期列表

【java】获取某一时间段内的所有日期

python 时间段的随机日期输出

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

LogN级别的区间查询算法(线段树), 你学会了吗

数论概论(英文版.第4版)

idea 更新后和新的直接安装前，都需要配置 idea64.exe.vmoptions 后再使用

CANOpen系列教程04_CAN总线波特率、位时序、帧类型及格式说明

Java序列化基础

java排序算法整理

异常：org.apache.ibatis.reflection.ReflectionException

（算法练习）——二路归并排序

go 闭包函数

好程序员web前端技术分享媒体查询

每日归档

更多

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)