NLP基础之Python正则表达式

Python正则表达式
正则表达式(regular expression)描述一种字符串匹配的模式,用来检查字符串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。

常用表达式

  • .*
    用来匹配所有内容

  • ()
    括号用来进行分组,取出已经匹配内容中的部分需要数据

  • *(?=r)
    表达式的含义向前寻找
    例如,“Windows(?=95|98|NT|2000)”能匹配“Windows2000”中的“Windows”,但不能匹配“Windows3.1”中的“Windows”。

  • .*(?<=row)
    表达式的含义反向寻找
    例如,“(?<=95|98|NT|2000)Windows”能匹配“2000Windows”中的“Windows”,但不能匹配“3.1Windows”中的“Windows”。

生成日志数据

#! /usr/bin/env python3

from datetime import datetime
import json
import random
import os
import sys
import time
import urllib
import

猜你喜欢

转载自blog.csdn.net/duan_zhihua/article/details/107592841