데이터 처리 팬더

1 타임 스탬프가 누락되지 않는 값 NaN이면 NAT로, 마찬가지로 ISNA () 또는 notna () 메소드 결정된
2 부가가치의 \ 중복을

df.dropna () 
df.drop_duplicates ()

3, 수직 보간 값

값 df.fillna (METHOD = '패드') #가 삽입되고, 상기 파라미터 = 한계 제거 할 수 
df.fillna은 (METHOD = 'bfill') # 보간 값은 다음과 같은 제한 시간 여러 보간 파라미터 일 수있다 취하는 값 나타내는 
df.fillna을 (pd.mean () [] ) #이 값 보간을 의미 열의 수 뒤에 플러그 
df.interpolate () # 선형 보간

보간 함수에 의하여 구현 된 상기 위치 데이터를 풀에 데이터를 알려진 보간의 이점)합니다 (보간과 같은 선형 보간법 데이터 자체를 복원하는 기본 선형 보간의 이점을 시도 할 데이터 분석의 분야에서 매우 일반적이며, 원래의 데이터 평균값 또는 다운 효과 (측값 연속 수치 변수의 존재 하에서)를 사용할 때 좋지,이 방법은 시도 할 수있다.
보간 상황 :

SciPy은 
- 데이터 빠른 성장률`메쏘드 = 'quadratic'` 차 보간을 선택할 수있다. - 방식의 누적 분포를 나타내는 데이터 세트, '방식 ='pchip'`을 선택하는 권장된다. - 기본값이 대상을 그리기 원활하게하기 위해 작성되는,`방법 = 'akima'`을 선택하는 것이 좋습니다.

4 시리즈

추가 추가

뺄셈 하위 

곱셈 MUL

부문 DIV

5, DataFrame

시간 간격 DATE_RANGE ()를 만듭니다 같은 pd.date_range ( '오늘'기간 = 6)

1)의 방법을 만들기 배열 어레이

2) 사전 방법

6, 기타 :

1) 열 번째 데이터 쿼리, 복수 열을 쿼리 [] '열 이름 1', '2 열 이름'] 대괄호 [], DF가 필요

2) 정렬 sort_values ​​() '= 의해

[]의 df.loc [ '' '']을 직접 수정한다 DF df.iat 3) 보정 값

대향 상부 4) 케이스 변환 df.str.lower () ()

 

...

 

 

 

 



 

추천

출처www.cnblogs.com/hqczsh/p/11599743.html