基础爬虫------正则表达式(常见的正则实例)

实例1:匹配.com和.cn网址:案例代码:
string = "<a href='http://www.baidu.com'>百度首页</a>'"
# string = "<a href='ftp://www.baidu.com'>百度首页</a>'"
data = "[a-zA-Z]+://[^\s]*[.com|.cn]"
result = re.compile(data).findall(string)
print(result)
实例1运行结果:
实例2 匹配电话号码:案例代码:
string = "sjgdshjdaj021-111011dhddjdj1111-255555655212"
data = "\d{4}-\d{1,}|\d{3}-\d{1,}"
result = re.compile(data).findall(string)
print(result)
实例2运行结果:
发布了98 篇原创文章 · 获赞 34 · 访问量 3万+

猜你喜欢

转载自blog.csdn.net/weixin_42133768/article/details/96561183