팬더 학습 6 : 색인

시리즈 인덱스는 DataFrame 선 레이블, 하나 개 이상의 인덱스가있을 수 있습니다. DataFrame 시리즈 및 단일 레벨 인덱스라고하는 인덱스 경우, 여러 인덱스가있는 경우는, 다단계 인덱스를했다. 그리고 데이터의 열 유사한 DataFrame SEREIS 지수는 다양한 데이터 형식을 가질 수 있습니다. 지수는 입력 : 정수 인덱스 (숫자 인덱스), 분류 지수 (카테고리 인덱스), 날짜와 시간 지수 (날짜 시간 색인, Timedelta 지수), 기간 지수 (기간 지수), 인덱스의 범위 (범위 지수), 간격 지수 (간격 지수) 다단계 인덱스 (다단계 인덱스).

멀티 레벨 지수 (다중 레벨 인덱스) 시퀀스 (계열)를 의미하거나, 데이터 블록 (DataFrame) 이차원 다중 색인 대응표 유사한 인덱스, 복수의, 즉 시리즈 또는 DataFrame는 DataFrame 유사한 구조를 갖는다 인덱스입니다.

가장 일반적으로 사용되는 지수는 정수 인덱스, 분류 지수와 날짜 인덱스입니다.

첫째, 기본 기능

가장 기본적인 생성자를 들어 인덱스를 생성한다 :

pandas.Index (데이터, DTYPE = 개체, 복사, 이름, tupleize_cols = 참)

매개 변수 참고 :

  • 데이터 : 인덱스를 생성하는데 사용되는 1 차원 배열과 유사한 목적은, 인덱스가 지시된다.
  • DTYPE : 기본 객체는 인덱스 요소의 유형을 나타내는입니다
  • 복사 : 입력 데이터의 사본
  • 이름 : 인덱스의 이름, 기본값은 지수입니다
  • tupleize_cols : True로 설정하면 시도가 다단계 인덱스 (MultiIndex)를 만듭니다.

예를 들어, 정수 인덱스를 만들 수 있습니다 :

>>> pd.Index ([1, 2, 3 ]) 
Int64Index ([ 1, 2, 3] = DTYPE ' INT64 ' )

재산의 둘째, 인덱스

지수는 특정 특성을 가진 2 차원 관계형 테이블과 유사합니다 :

  • 값 : 인덱스 값
  • is_monotonic, is_monotonic_increasing, is_monotonic_decreasing : 单调
  • is_nuique, has_duplicates : 고유 값, 중복 된 값,
  • hasnans : 값은 NA 있는가
  • 데이터 타입 인덱스 요소 : DTYPE
  • 이름 : 속성 인덱스의 이름,
  • 이름 : 인덱스가 다단계 (다단계)의 경우, 각각의 하나는 이름을 가지고
  • 인덱스 요소의 수 : 크기
  • T : 인덱스 전치

인덱스의 값 셋째, 부족

값이 아닐 때 NA false를 반환; NA 참 리턴 값이 때 각 인덱스 값에 대해 누락 값 ISNA ()에 대한 검사가 검사된다. 값이 NA없는 True를 반환 할 때 인덱스의 각 값에 대해 notna은 (), 체크, 때 NA의 값, 거짓 반환.

Index.isna (자기) 
Index.notna (자기)

측값 채운 스칼라 값 NA로 채워진 다운 캐스트 타입 하향 호환성을 나타낸다 :

Index.fillna (자기, 값 = 없음, 다운 캐스트 = 없음)

누락 된 값 삭제, 매개 변수가 누락 된 값을 제거하는 방법, 유효한 값은 어떠한 모든 방법을 나타냅니다 :

Index.dropna (자기, 어떻게 = ' 어떤 ' )

넷째, 인덱스 순위

인덱스의 값으로 정렬하지만, 지수는 지수 * 인수 및 ** kwargs로 매개 변수가 함수 매개 변수의 numpy.ndarray.argsort에 전달됩니다를 반환합니다.

Index.argsort (자기 * 인수, ** kwargs로)

인덱스의 값으로 정렬, 정렬의 사본을 반환 매개 변수가 return_indexer 인덱스 첨자를 반환 여부를 나타냅니다 :

Index.sort_values ​​(자기, return_indexer = 거짓, 오름차순 = 참)

예를 들어, 인덱스를 다음과 같은 :

>>> IDX pd.Index = ([ ' B ' , ' ' , ' D ' , ' C ' ]) 
지수 ([ ' B ' , ' ' , ' D ' , ' C ' , DTYPE = ' 객체 ' )

인덱스 값으로 정렬, 인덱스 수익률은 인덱스 정렬 :

>>> 순서 = idx.argsort ()
 >>> 순서 
배열 ([ 1, 0, 3, 2])

다음과 같은 기준에 의해 정렬 된 인덱스의 값을 확인하려면 :

>>> IDX [순서] 
인덱스 ([ ' ' , ' B ' , ' C ' , ' D ' , DTYPE = ' 오브젝트 ' )

물론, 당신은 또한 직접 정렬 된 인덱스를 반환 할 수 있습니다 :

>>> idx.sort_values () 
지수 ([ ' ' , ' B ' , ' C ' , ' D ' , DTYPE = ' 오브젝트 ' )

정렬 된 인덱스와 해당 첨자를 반환하려면 매개 변수 return_indexer = TRUE를 설정합니다 :

>>> idx.sort_values (return_indexer = 참) 
(인덱스 ([ ' ' , ' B ' , ' C ' , ' D ' , DTYPE = ' 오브젝트 ' ) 배열 ([1, 0, 3, 2] , DTYPE = INT64))

변환의 다섯 번째 인덱스

 인덱스리스트로 변환 될 수 DataFrame 시퀀스 어레이 (ndarray)와 같은 라벨 () 함수는 배열 형태로 확장 인덱스 사용된다.

Index.to_list (자기) 
Index.to_frame (자기, 인덱스 = 사실, 이름 = 없음) 
Index.to_series (자기, 인덱스 = 없음, 이름 = 없음) 
Index.ravel (자기 순서 = ' C ' )

변환 형 인덱스 값이 지정된 유형 :

Index.astype (자기, DTYPE = 등본)

여섯 개 인덱스 값을 운영

인덱스 값은 가장 일반적으로 사용되는 기능은 인덱스 작업 아래에 나열되어, 일련의 조작을 할 수 있습니다 :

1, 인덱스는 인덱스의 최대 또는 최소를 반환

Index.argmin (자기 축 = 없음, skipna = TRUE, 인수 *, ** kwargs로) 
Index.argmax (자기 축 = 없음, skipna = TRUE, 인수 *, ** kwargs로)

2, 인덱스 값을 삭제

지정된 인덱스를 삭제

Index.delete (자기, LOC) 
Index.drop (자기, 레이블, 오류 = ' 인상 ' )

3, 중복 된 값

drop_duplicates () 함수가 중복 값을 삭제하는 데 사용되는 매개 변수의 유효 값은 첫째, 먼저 거짓과 거짓, 프리스트 예약, 마지막 마지막 예약을 유지하고, 거짓은 중복 값을 삭제 나타냅니다.

Index.drop_duplicates은 (자기 = 유지 '를 첫 번째 ' )

상기 인덱스 값은 반복 값 True로 인덱스 값의 값에 대응하는 위치를 반복 여부를 확인한다.

Index.duplicated은 (자기 = 유지 '를 첫 번째 ' )

4, 새로운 값을 삽입

Index.insert (자기, LOC, 항목)

5, 인덱스 이름 속성의 이름을 변경

Index.rename (자기, 이름, 인플레 이스 = 거짓)

6 인덱스 값만

Index.unique (자기 레벨 = 없음)

(7) 상기 인덱스 첨자를 취득

첫 번째 방법은 인덱스 값 목록을 전달하는 것입니다 :

Index.get_indexer (자기 대상, 방법 = 없음, = 제한 없음, 공차 = 없음)

매개 변수 참고 :

대상 : 색인 목록

방법 : 없음, '패드'/ 'ffill', '채움'/ 'bfill', '가까운'

  • 없음 전체 일치를 표현하지 :
  • 패드 / ffill는 : 일치하는 경우, 이전 값은 비 NA를 찾을 수
  • 백필 / bfill 님의 일치는 NA가 아닌 값을 찾은 후, 존재하지 않는 경우
  • 가까운 : 일치하는 경우, 가장 가까운 비 NA 값을 찾을 수

그것은 완전히 대상에서 연속 태그의 최대 수와 일치하지 않습니다 제한

공차하십시오 간의 정합 위치까지의 최대 거리의 지표 값은 완벽하게 원래의 인덱스 및 신규 인덱스 가장 만족 방정식 ABS (인덱스 [인덱서] -target) <= 공차 일치하지.

 두 번째 방법은 스칼라 값을 반환 위치 인덱스의 스칼라 값의 인덱스를 전달한다 :

Index.get_loc (자체, 키, 방법 = 없음, 허용 오차 = 없음)

인덱스의 일곱 개 다른 유형

  • 1, 정수 인덱스
  • 2. 분류 색인
  • 3, 인덱스 날짜

 

 

참조 문서 :

팬더 지수

 

추천

출처www.cnblogs.com/ljhdo/p/11556410.html