版权声明://若需转载,请各位大虾注明出处,小生在此有礼. https://blog.csdn.net/sos768/article/details/84311249
这几天疯狂学习了爬虫,期中一个为了签到
短短几行代码,包括f12加保存摸索了很久,希望可以登录学校的网站,好了,废话不多说,进入正题:
1.安装requests,真正面对人类的工具,是真的有用,大家也可以使用下urllib和urllib3,其中的功能是差不多得,不过urllib里面的功能实现更加复杂,微调的地方也更加多
2.先附上练手篇:不需要验证码
import requests
import json
url="https://hbs.newitd.com/login"//这个抢红包的登录页面
url1="https://hbs.newitd.com/sign_in"//签到页面
data={
'phone':"xxxxx",//用户名
'password':'xxxxx'//密码
}
sess = requests.session()
rsp = sess.post(url,data=data)
json1 = json.loads(rsp.text)
res1 = sess.post(url1)
json2 = json.loads(res1.text)//转码
print(json1)
print(json2)
3.接下来转入学校登录需要验证码= =
验证码说明:
valcode = requests.get(codeurl)
f = open('valcode.jpg','wb')#以二进制方式写入
f.write(valcode.content)
f.close()
# code = input('请输入验证码:')#这两行是手写输入验证码得做法
#data['txtSecretCode'] = str(code)
img = Image.open('valcode.jpg')
img.show();
print(s)