데이터 분석 파이썬 -Pandas를 사용하여 수행 하였다

데이터 분석은 파이썬 -Pandas를 사용하여 수행되었다 :

  팬더 두 가지 데이터 유형, 즉 시리즈 및 DataFrame에서 가장 중요한 도서관. 다음 이야기의 내용은 주로 주변의 두 가지 측면을 배치!

  데이터 분석하는 동안, 우리는이 두 가지 기본 타사 라이브러리는 데이터 처리에 특히 중요하다는 것을 알고, 데이터베이스 팬더는 NumPy와 라이브러리 있었고, 우리는 항목 NumPy와이 장에서 우리에 대한 자세한 설명은 이전 섹션을 팬더 라이브러리 중심으로 체계적으로 요약. 그는 시간 전에 기본적으로 인터넷에서 동영상을보고, 지식을 학습하지만, 비디오를 볼 때, 기본적 지식에 대한 메모를하지 않는, 이해하고 매우 간단 느낄 수 있었다 나중에 천천히, 약간의 여담을 말한다 내용을 많이 잊어 느리게, 속담, 졸업 후 자신의 지식 그래서 미래의 문의를 지식 포인트를 용이하게하기 위해, 블로그에 기록하려고합니다, 그래서 나쁜 서면으로 좋은 메모리.

환경의 사용에 의해 컴파일이 문서 :

파이썬 : 3.6.6 컴파일러 : pycharm 운영 체제 : win10

A, 시리즈

1, 구조의 시리즈 :

구성 데이터 및 관련 인덱스 데이터의 집합으로 시리즈를 입력 :

 예를 들면 :

수입 PD 등 팬더 = pd.Series ([9, 8, 7, 6 ])
 인쇄 (a)
0-9 
1-8 
2-7 
3-6 
DTYPE : INT64

이상의 결과에서, 우리는 팬더 라이브러리가 자동으로 데이터에 인덱스를 증가 볼 수 있습니다! 그러나 우리는 인덱스 값을 제공 할 수있는 인덱스 매개 변수를 사용하여, 사용자 정의 인덱스를 제공 할 수 있습니다 :

수입 PD 등의 팬더 
B = pd.Series ([9, 8, 7, 6, 인덱스 = ' ' , ' B ' , ' C ' , ' D ' ])
 인쇄 (b)
9 
8 B 
C 7 
D 6 
DTYPE : INT64

위의 우리는 인덱스 데이터는 우리가 제공하는 인덱스 값으로 변경되었음을 볼 수 있습니다!

2, 창조의 시리즈 유형 :

  1. 당신은 파이썬 목록을 만들 수 있습니다;
  2. 스칼라 값 (값)에 의해 생성 될 수있다;
  3. 당신은 파이썬 사전을 만들 수 있습니다;
  4. 그것은 ndarray 만들 수 있습니다;
  5. 그것은 다른 기능에 의해 생성 될 수있다.

 예를 들면 :

스칼라 값에서 만들어진 등재 스칼라 값을 사용하는 경우, 인덱스는 생략 될 수있다 :

수입 PD 등 팬더 
S = pd.Series (25, 인덱스 = ' ' , ' B ' , ' C ' ])
 인쇄 (S)
25 
25 B 
C 25 
DTYPE : INT64

 사전 유형에서 만든 :

수입 PD 등의 팬더 
D = pd.Series ({ ' ' : 9 ' B ' : 8, ' C ' 7 })
 인쇄 (d)
9 
8 B 
C 7 
DTYPE : INT64

또한 : 사전을 생성 할 때, 상기 인덱스 값은 동작 인덱스에 따라 선택 될 수있다 :

수입 부분 방전 등 팬더 
E = pd.Series ({ ' ' : 9 ' B ' : 8, ' C ' 7}, 인덱스 = ' C ' , ' ' , ' B ' , ' D ' ])
 인쇄 (전자)
C 7.0 
9.0 
B 8.0 
D의 NaN 
DTYPE : float64

NaN이 때의 값에 대응하는 인덱스 값이 표시되지 않는다.

 만들 ndarray 유형에서 : 인덱스를 제공하지 않을 경우, 일련의 자동 인덱싱을 제공합니다

수입 PD 등의 팬더
 수입 NP NumPy와 같이 

N = pd.Series (np.arange (5 ))
 프린트 (N)
0 0 
1 1 
2 2 
3 3 
4 4 
DTYPE : INT32

ndarray 유형을 만들 수에서 : 인덱스를 제공 할 때, 시리즈가 제공하는 인덱스를 사용

수입 PD 등의 팬더
 수입 NumPy와 순이익 같이 


m이 pd.Series (np.arange (5), 인덱스 = np.arange (9, 4, -1 = ))
 프린트 (m)
9 0 
8 1 
7 2 
6 3 
5 4 
DTYPE : INT32

3, 타입 시리즈의 기본 동작

 인덱스 값 시리즈는 두 부분을 포함하는 입력 점에서, 인덱스와의 연산에 대한 이론 값의 일련의 동작을 위해 :

예를 들어 : 첫째, 일련의 유형을 작성

수입 PD 등의 팬더 
B = pd.Series ([9, 8, 7, 6], [ ' ' , ' B ' , ' C ' , ' D ' ])
 인쇄 (b)
9 
8 B 
C 7 
D 6 
DTYPE : INT64

인덱스 값의 시리즈 유형 : 다음과 같은 방법있는 .index를 사용하여

인쇄 (b.index)
지수 ([ 'A', 'B', 'C', 'D', DTYPE = '오브젝트')

데이터 계열 유형 : .values를 이용하여 이하의 방법

인쇄 (b.values)
[9 8 7 6]

또한, 분할의 형태로 사용될 수있는 값을 참조 :

인쇄 (b [ ' B ' ])
8
토너 (b [1])
8

  

추천

출처www.cnblogs.com/lsyb-python/p/11938662.html