py 的第 17 天 - 代码天地

py 的第 17 天

其他 2018-08-18 13:31:07 阅读次数: 0

import re 这个re就是下面的英文单词，不过不用打出来，打re就行了，下面默认re就是读取正式表达式，regex翻译过来就是正。。。。

永远不要起一个py文件的名字这个名字和你一致的模块同名

regex

查找

findall:匹配所有每一项都是列表中的一个元素

ret=re.findall('\d+','xxxxxxxxxxxxx')正则表达式，带匹配的字符串，flag，把一个数字组是一组打出来

ret=re.findall('\d','xxxxxxxxxxxxxxx')正则表达式，带匹配的字符串，flag，每一个数字单独打出来

print（ret）

search：只匹配从左到右的第一个，得到的不是直接的结果，而是一个变量，通过这个变量的group方法来获取结果

如果没有匹配到，会返回None，使用group会报错

ret=re.search('\d+','xxxxxxxxxxxxx')

pritn(ret) 内存地址，这是一个正则匹配的结果

print(ret.group()) 这样才通过ret.group()获取真正的结果但是只会获取第一个数字串

ret=re.search('\d','无数字的字符串‘）

print(ret) 这个打印的是None 没有地址

print(ret.group()) 这个就是直接报错了

ret=re.search('\d+','字符串‘)

if ret : #内存地址，这是一个正则匹配的结果

　　print（ret.group()) 通过ret.group（）获取真正的结果

match 从头开始匹配，相当于search中的正则表达式加上一个^

ret=re.match('\d$','字符串')

print(ret) 这个是个坑默认要求一个^ 带一个$就是只取数字了，字符串不是纯数字就None，报错

字符串处理的扩展：替换切割

split

s='alex|taibai|engo|'

print(s.split('|'))

s='alex83taibai40egon25'

ret=re.split('\d+',s) 这个s必须在最后，否则就是打印d那些了

print(ret)

sub 把xx换成xx 字符串，后面可以有数字，没有就是满足条件的都来，

ret=re.sub('\d+','h',‘字符串’) 把这个字符串里的数字（组）都换成h 没有加号就是每个数字

ret=re.sub('\d+',h,'字符串',1) 把这个字符串里的第一个数字（组）换成h，同上

subn 返回一个元素组，第二个元素是替换的次数

ret=re.subn('\d+','h','字符串')这个打印出来在正常换完的基础上，后面多一个数字告诉你换了几次，这个后面自己加数，就是等于普通的sub了

re模块的进阶：时间/空间

compile 节省你使用正则表达式解决问题的时间

先编译出一个正则表达式，编译成一个变量，在接下来就可以直接使用这个变量了，节省时间

# ret = re.compile('\d+') # 已经完成编译了

# print(ret)

# res = ret.findall('alex83taibai40egon25')

# print(res)

# res = ret.search('sjkhk172按实际花费928')

# print(res.group())

现在ret就是/d的意思了

finditer 节省你使用正则表达式解决问题的空间/内存

ret=re.finditer（'\d+','字符串'）

for i in ret

　　print(i.group()) 这个i就等于ret了这很正常

findall 返回列表，找到所有的匹配项

search 匹配，就返回一个变量，通过group取匹配到的第一个值，不匹配就返回None，group会报错

match 相当于search的正则表达式中加个‘^‘

spilt 返回列表，按照正则规则切割，默认匹配到的内容会被切掉

sub/subn 替换，按照正则规则去寻找要被替换掉的内容，subn，返回元组，第二个值是替换的次数

compile 编译一个正则表达式，用这个结果去 search，match，findall，finditer 能够节省时间

finditer 返回一个迭代器，所有的结果都在这个迭代器中美需要进行循环+group的形式取值，能够节省内存

import re

s='<a>字符串</a>' 标签语言 html网页

ret=re,search('<(\w+)>(\w+)</(\w+)>',s) 这个s只能在条件后面

print(ret.group()) 打印所有的结果，

print(ret.group(1)) 数字参数代表的是取对应分组中的内容以w+为一组

为了findall也可以顺利取到分组中的内容，有一个特殊的语法，就是优先显示分组中的内容

ret=re.findall('(\w+),s)

print(ret) 这样把左右两边的的a也打印出来了

ret_re.findall('>(\w+)<',s)

print(ret) 这样就是只打印中间的字符串了

取消分组优先（？：正则表达式）

ret=re.findall('\d+(\.\d+)?','数字串例如小数1.234*4。3‘）在括号的最前面加？：(？：\.\d+)

print（ret）取消优先，别的不取消

分组约束某一组字符出现的次数，分组帮助你更精准的找到你真正需要的内容

split

ret = re.split('\d+','alex83taibai40egon25')

print(ret)

ret = re.split('(\d+)','alex83taibai40egon25aa')

print(ret) 这个比较小众，这样切割完数字会保留下来

分组命名 (?P<这个组的名字>正则表达式)

s = '<a>wahaha</a>'

ret = re.search('>(?P<con>\w+)<',s)

print(ret.group(1))

print(ret.group('con')) 这个就是命名个分组，然后

猜你喜欢

转载自www.cnblogs.com/Mrszhao/p/9496901.html

py 的第 17 天

py 的第 7 天

py 的第 9 天

py 的第 10 天

py 的第 16 天

py 的第 18 天

py 的第 23 天

py 的第 33 天

py 的第 36 天

py 的第 38 天

py 的第 39 天

py 的第 37 天

py学习第8天

PY划水第2天

Android初学第17天

常用API第17天

CRM分页 ——第17天

python学习第17天

学习java的第17天

学习LINUX的第17天

第31月第17天 resolveInstanceMethod

第37月第17天 AI

我的android 第17天 - Contant Provider

python全栈脱产第17天

18.8.14 下午第17天上课

18.8.14 上午第17天上课

python第17天-网络复习

实习第17-20天

英语流利说第17天

第17天Service基础知识

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)