자세한 파이썬 팬더 문자열 기능 수 (rpm)

 자세한 팬더 문자열 함수 (회전) - 원래 연결은 문서의 끝을 볼

필요 문자열 속성 중 일부를 해결하는 경우, DataFrame 판다 프레임을 사용하여, 예를 들어 열은 마스터 칼럼 STR 내장 경우 방법 열의 문자 길이가 3 미만 등이 요구인지, 키워드를 포함하는지 여부를 판정한다 훨씬 쉽게 그들과 거래를합니다.

        의는 STR을 제공 자세히 살펴, 시리즈 수준의 방법을 보자.

1, 고양이 () 문자열 연결
        예제
        . >>> 9월 시리즈에 ([ 'A', 'B', 'C']) str.cat ([ 'A', 'B', 'C', = '')
        0 A하는
        1 B, B.
        (2) C, C
        DTYPE : 개체
        . 시리즈 (구월 = ON ([ 'A', 'B', 'C']) str.cat '') >>>
        ' A, B, C '
        >>> 시리즈 (['A ','B '). str.cat (['X ','Y '], [.'1 ','2 '] 9 월 = ON '')
        0 A, X ,. 1
        1 B, Y, 2.
        DTYPE : 오브젝트
2 분할 () 슬라이싱 문자열
        >>> 오기 NumPy와, 팬더]
        >>> pandas.Series의 S의 = ([ 'a_b_c' 'c_d_e', numpy.nan 'f_g_h '])
        >>> s.str.split ('_ ')
        0 [A, B, C]
        1 [C, D, E]
        2 NaN이
        3 F, G, H]
        DTYPE : 오브젝트
        >>> s.str.split ( '_'-1)
        0 [A, B, C]
        1 [C, D, E]
        2 NaN이
        3 F, G, H]
        DTYPE : 오브젝트
        >> > s.str.split ( '_', 0)
        0 [A, B, C]
        (1) [C, D, E]
        2 NaN이
        3 F, G, H]
        DTYPE : 오브젝트
        >>> s.str.split ( '_', 1)
        0 [A, b_c]
        1 [C, d_e]
        2 NaN이
        3 F, g_h]
        DTYPE : 오브젝트
        >>> s.str.split ( '_', 2)
        0 [A, B , C]
        1 [C, D,e]
        2 NaN
        . (3) [F, G, H]
        DTYPE : 개체
        >>> s.str.split ( '_',. 3)
        0 [A, B, C]
        . (1) [C, D, E]
        2 NaN3를
        . 3 F, G, H]
        DTYPE : 개체
. 3) (GET 지정된 위치 문자열을 취득
        >>> s.str.get (0)
        0
        (1) C.
        2 NaN3를
        3 F.
        DTYPE : 개체
        >>> s.str.get. (1)
        0 _
        1 _.
        2 NaN3를
        3 _.
        DTYPE : 개체
        >>> s.str.get (2)
        0 B
        . 1 D
        2 NaN3를
        . 3 G
        DTYPE : 개체
. 4 가입은 ()하지 일반적으로 함께 바느질의 지점에 각각의 문자열에 사용되는
        >>> s.str.join ( "!")
        0 호 A _ B의 C !!!!
        . 1 C! ! D _ _ E!
        2 NaN3를
        3 F G H _ _ !!.
        DTYPE : 개체
        >>> s.str.join ( "?")
        0 _ _ B C를 ????
        . 1 _ C ?? ?? D _ E
        2 NaN3를
        ?? 3 F G H _ _ ??.
        DTYPE : 개체
        >>> s.str.join "."
        0 ._ A B C .. ._
        . 1 D의 C ._ .. _.e
        2 NaN3를
        ._ F G H .. 3 ._.
        DTYPE : 개체
.도 5에 도시 된 바와 같이, 포함 ()은 식 포함
        >>> s.str.contains ( 'D'를)
        0 거짓
        1 트루
        2 NaN이
        3 거짓
        DTYPE : 오브젝트
6은替换) (교체
        ( "_", ".") s.str.replace >>>
        0 ABC
        1 CDE
        2 NaN이
        3 FGH의
        DTYPE : 오브젝트
7 반복 ()重复
        >>> s.str.repeat (3)
        0 a_b_ca_b_ca_b_c
        1 c_d_ec_d_ec_d_e
        2 NaN이
        3 f_g_hf_g_hf_g_h의
        DTYPE : 객체
8 패드 ()左右补齐
>>> s.str.pad (10 fillchar = "")
0 ????? a_b_c
1 c_d_e ?????
2 NaN이
3 ?????의 f_g_h의
DTYPE : 오브젝트
>>>
S.str.pad >>> (10, 사이드 = "오른쪽", FillChar = "")
0 ????? a_b_c
1 c_d_e ?????.
2 NaN3를
????? 3 f_g_h.
DTYPE : 개체
. 9 센터 () 중간체 충전은 실시 예를 참조
>>> s.str.center (10 FillChar = "?"를)
0 ?? a_b_c ???
. ?? 1 c_d_e ???
2 NaN3를
. 3 ?? f_g_h을 ???
DTYPE : 개체
10 ljust ()는 예를 참조 권리 작성
>>> s.str.ljust (10 FillChar = "")
0 ????? a_b_c
????? c_d_e 1.
2 NaN3를
3 f_g_h.? ????
DTYPE : 개체
11 rjust () 가득 왼쪽 참조 예
">>> s.str.rjust (10 fillchar = ?")
0 ????? a_b_c
1 ????? c_d_e
2 NaN이
3 ????? f_g_h의
DTYPE : 물체
12 zfill () 왼쪽 보수 0
>>> s.str.zfill (10)
0 00000a_b_c
. 1 00000c_d_e
2 NaN3를
3 00000f_g_h.
DTYPE : 오브젝트
의 지정된 위치 (13)는, 랩 () 캐리지 리턴 기호
>>> s.str. 랩 (3).
0 a_b의 \ N_C
1 C_D \의 n_e.
2 NaN3를
3 f_g N_H \.
DTYPE : 오브젝트
(14), 슬라이스 (절단 문자열의 끝 부분을 눌러 시작점)
>>> s.str.slice (1,3)
0 _B
. 1 _D
2 NaN3를
3의 _G.
DTYPE : 개체
15 slice_replace ()는 소정의 문자열, 문자 여분의 위치 지정
>>> s.str.slice_replace (1 ,. 3. "?")
0 _c?
1. ? C _E
2 NaN이
3 F의 _H?
DTYPE : 개체
>>> s.str.slice_replace (1, 3, "?")
0 _ C ??
E C ?? _ 1.
2 NaN3를
3 F H ?? _.
DTYPE : 개체
단어의 발생 16 COUNT ()가 계산된다 주어진 수
>>> s.str.count ( "A")
0 1
1 0.
2 NaN3를
3 0.
DTYPE : float64
. 17 startsWith ()이 결정으로 시작할지 주어진 문자열
>>> s.str.startswith ( "A"),
0 참
1 거짓.
2 NaN3를
3 거짓.
DTYPE : 개체
endsWith ()가 소정의 여부를 판정 (18)이고, 문자열의 끝
>>> s.str.endswith ( "E");
0 거짓
한 사실
이 NaN의
3 거짓
DTYPE이 : 개체
, 정규 표현식과 일치하는 모든 문자를 찾기 위해, findall은을 () (19)는 배열로 반환
>>> s.str.findall ( "[AZ]");
0 [A, B, C]
. (1) [C, D,E]
2- NaN이
3 F, G, H]
DTYPE은 : 객체
(20)는, 매치 () 모든 문자열 포인트 또는 표현과 일치하는지 여부를 검출
>>> S
0 a_b_c
. 1 c_d_e
2 NaN3를
. 3 f_g_h
대상 : DTYPE
>>> s.str.match ( "[DZ를]") ;
0 거짓
1 거짓
이 NaN의
3 사실
DTYPE : 개체
(21), 추출 () 쉬었 일치 문자열, 괄호를 추가 할주의, 당신은에 표시 뭔가 추출해야
>>> s.str.extract를 ( "([ DZ]) "),
0 NaN3를
1 D.
2 NaN3를
3 F.
DTYPE : 오브젝트
문자열 (22)의 길이를 계산하고, LEN ()
>>> s.str.len ()
0.5
. 1.5
2 NaN3를
. 3.5
DTYPE은 : float64 
23은, 전 및 공백 문자의 제거 후 스트립 ()
>>> IDX pandas.Series = ([ '잭 ', '질''제시', '프랭크'])
Idx.str.strip >>> ()
0 잭
1 질.
2 제시
3 솔직한.
DTYPE : 오브젝트
(24), rstrip ()는 나중에 제거 공백
공백 항 제거 25 lstrip ()
(26), 격벽 () 문자열들의 어레이 DataFrame는 절단이라고하지만, 세 부분이라고 컷트 메모, 제 세퍼레이터 세퍼레이터 세퍼레이터 절단
오른쪽 절단) (27 rpartition 및 상승
>>> s.str.partition ( '_')
 0 1 2
0 _ B_c
. 1 C _ D_E
2 NaN3를 NaN3를 NaN3를
. 3 F _ G_h
>>> s.str.rpartition ( '_')
 0 1 2
0 _ C a_b
. 1 C_D _ E
2 NaN3를 NaN3를 NaN3를
. f_g 3 _ H
(28), 낮은 ()의 모든 하부 케이스
(29), 상부 () 모두 캡
(찾을, 30)을 소정의 캐릭터의 위치를 찾기 위해 좌측에서
>>> s.str.find ( 'D'를)
0 -1
1 2
NaN3를 2
3 -1.
DTYPE는 : float64
31이다 rfind ()는 주어진 문자열의 위치를 찾기 위해, 오른쪽부터

(32), 인덱스 () 지정된 문자열의 위치를 찾을 문자열이 존재하지 않는 경우, 다음 불평 않습니다!
33, 오른쪽 rindex ()는, 주어진 문자열의 위치를 찾을
>>> s.str.index ( '_')를
0 1
1 1.
2 NaN3를을
3 1.
DTYPE : float64
34) (대문자 첫 글자를 대문자이다
>> > s.str.capitalize ()
0 A_b_c
. 1 C_d_e
2 NaN3를
. 3 F_g_h
DTYPE : 개체
35 swapcase () 경우 반전
>>> s.str.swapcase ()
0 A_B_C
. 1 C_D_E
2 NaN3를
. 3 F_G_H
DTYPE 께 : 개체
36 , 노멀 () 직렬화 된 데이터는 거의 우리가 공부를하지 않을 데이터 분석을 사용하지
여부 모든 숫자와 문자 isalnum () 37
>>> s.str.isalnum ()
0 거짓
. 1 거짓
이 NaN3를
. 3 거짓을
DTYPE : 객체
38 isalpha에 () 여부를 모든 문자
>>> s.str.isalpha ()
거짓
1 거짓.
2 NaN3를
3 거짓.
DTYPE : 개체
39 isdigit에 () 모두가 디지털인지 여부
>>> s.str.isdigit ()
거짓 0
. 1 거짓
2 NaN3를
. 3 거짓
DTYPE : 개체
40 isspace와이된다 () 여부 공간
>>> s.str.isspace ()
거짓
1 거짓.
2 NaN3를
3 거짓.
DTYPE : 개체
(41)는, islower와 () 모두 소문자 여부
42 isupper () 모든 대문자
>>> s.str.islower ()
0 진정한
한 사실
이 NaN의
3 사실
DTYPE : 개체
>>> s.str.isupper ()
0 거짓
1 거짓
이 NaN의
거짓 3
DTYPE : 개체
43 istitle () 첫 번째 문자가 소문자로 다른 문자를 대문자로 된 경우에만
>>> s.str.istitle ()
거짓
1 거짓
2 NaN이
3 거짓
DTYPE : 개체
44 ISNUMERIC ()는 그 디지털인지
45, isdecimal () 여부를 모든 디지털
---------------------
저자 : 빅 데이터 분석 전투
소스 : CSDN
원본 : HTTPS : //blog.csdn.net / qq_28219759 / 기사 / 세부 / 52919233
저작권 :이 문서는 블로거 원래 기사, 복제, 첨부하십시오 보웬 링크입니다!

추천

출처www.cnblogs.com/keeptg/p/11057621.html