지금까지 우리는 세 가지 덮여있다 팬더의 데이터 구조를하고이를 만드는 방법. 이 실시간 데이터 처리에있어서 매우 중요하며, 다른 데이터 구조가 또한 설명되어 있으므로 다음 데이터 프레임 (DataFrame) 객체에 초점을 맞출 것이다.
첫째, 기본 기능의 시리즈
수 | 속성 또는 메서드 | 기술 |
---|---|---|
1 | axes |
행 레이블이 축 목록을 반환합니다. |
이 | dtype |
개체의 데이터 형식을 반환합니다 ( dtype ). |
삼 | empty |
시리즈가 비어있는 경우, 반환 True . |
4 | ndim |
기본 데이터, 기본 정의의 차원의 수를 돌려줍니다 1 . |
5 | size |
기본 데이터 요소의 수를 돌려줍니다. |
6 | values |
A와 시리즈 ndarray 돌아갑니다. |
(7) | head() |
이전으로 돌아 가기 n 행. |
8 | tail() |
마지막 반환 n 행을. |
이제 일련의 작업을 생성하고 위의 모든 속성을 사용하는 방법을 보여줍니다.
수입 PD 등의 팬더 수입 NP NumPy와 같이 S = pd.Series의 (np.random.randn (4 )) 프린트 (S)
출력 :
0 0.967853
1 -0.148368 2 -1.395906 3 -1.758394 dtype: float64
예 축
수입 PD 등의 팬더 수입 NP NumPy와 같이 S = pd.Series의 (np.random.randn (4 )) 인쇄 ( " 축은은 : " ) 인쇄 (s.axes)
출력 :
The axes are:
[RangeIndex(start=0, stop=4, step=1)]
빈 예
그것은 개체가 비어 있는지 여부를 나타내는 부울 값을 반환합니다. 반환 True
대상이 비어 있음을 의미한다.
수입 PD에로 팬더 수입 순이익 등 NumPy와 의 =의 pd.Series (np.random.randn (4 )) 인쇄 ( " 개체가 비어 있습니까? " ) 인쇄 (s.empty)
输出结果:
Is the Object empty?
False
ndim 예
오브젝트의 사이즈를 돌려줍니다. 정의에 의하면, 일련의 A는 1D
다음 샘플 코드를 참조하여, 데이터 구조
수입 PD 등의 팬더 수입 NP NumPy와 같이 S = pd.Series의 (np.random.randn (4 )) 프린트 (S) 의 인쇄 ( " \ n을 ' ) 인쇄 ( " 개체의 치수 : " , s.ndim)
출력 -
0 0.175898
1 0.166197
2 -0.609712
3 -1.377000
dtype: float64
The dimensions of the object:1
크기 예
시리즈 (길이)의 사이즈를 돌려줍니다. 다음 샘플 코드를 참조
수입 PD 등의 팬더 수입 NP NumPy와 같이 S = pd.Series의 (np.random.randn (2 )) 프린트 (S) 의 인쇄 ( " \ n을 ' ) 인쇄 ( " 개체의 크기 : " , s.size)
출력 :
0 3.078058
1 -1.207803
dtype: float64
The size of the object:2
값의 예는
以数组形式返回系列中的实际数据值。
import pandas as pd import numpy as np s = pd.Series(np.random.randn(4)) print(s) print('\n') print ("The actual data series is:",s.values)
输出结果:
0 1.787373
1 -0.605159
2 0.180477
3 -0.140922
dtype: float64
The actual data series is:[ 1.78737302 -0.60515881 0.18047664 -0.1409218 ]
head()和tail()方法示例
要查看Series或DataFrame对象的小样本,请使用head()
和tail()
方法。
head()
返回前n
行(观察索引值)。要显示的元素的默认数量为5
,但可以传递自定义这个数字值。
tail()
返回最后n
行(观察索引值)。 要显示的元素的默认数量为5
,但可以传递自定义数字值。
import pandas as pd import numpy as np s = pd.Series(np.random.randn(4)) print ("The original series is:") print(s) print('\n') print ("The first two rows of the data series:") print(s.head(2)) print('\n') print ("The last two rows of the data series:") print(s.tail(2))
输出结果:
The original series is: 0 0.720876 1 -0.765898 2 0.479221 3 -0.139547 dtype: float64 The first two rows of the data series: 0 0.720876 1 -0.765898
dtype: float64
The last two rows of the data series:
2 0.479221
3 -0.139547
dtype: float64
二、DataFrame基本功能
下面来看看数据帧(DataFrame)的基本功能有哪些?下表列出了DataFrame基本功能的重要属性或方法。
编号 | 属性或方法 | 描述 |
---|---|---|
1 | T |
转置行和列。 |
2 | axes |
返回一个列,行轴标签和列轴标签作为唯一的成员。 |
3 | dtypes |
返回此对象中的数据类型(dtypes )。 |
4 | empty |
如果NDFrame 完全为空[无项目],则返回为True ; 如果任何轴的长度为0 。 |
5 | ndim |
轴/数组维度大小。 |
6 | shape |
返回表示DataFrame 的维度的元组。 |
7 | size |
NDFrame 中的元素数。 |
8 | values |
NDFrame的Numpy表示。 |
9 | head() |
返回开头前n 行。 |
10 | tail() |
返回最后n 行。 |
下面来看看如何创建一个DataFrame并使用上述属性和方法。
import pandas as pd d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack']), 'Age':pd.Series([25,26,25,23,30,29,23]), 'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])} df = pd.DataFrame(d) print ("Our data series is:") print(df)
输出结果:
Our data series is:
Age Name Rating
0 25 Tom 4.23
1 26 James 3.24
2 25 Ricky 3.98
3 23 Vin 2.56
4 30 Steve 3.20
5 29 Minsu 4.60
6 23 Jack 3.80
T(转置)示例
返回DataFrame
的转置。行和列将交换。
import pandas as pd d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack']), 'Age':pd.Series([25,26,25,23,30,29,23]), 'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])} df = pd.DataFrame(d) print ("The transpose of the data series is:") print(df.T)
输出结果:
The transpose of the data series is:
0 1 2 3 4 5 6
Age 25 26 25 23 30 29 23
Name Tom James Ricky Vin Steve Minsu Jack
Rating 4.23 3.24 3.98 2.56 3.2 4.6 3.8
axes示例
返回行轴标签和列轴标签列表。
import pandas as pd d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack']), 'Age':pd.Series([25,26,25,23,30,29,23]), 'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])} df = pd.DataFrame(d) print ("Row axis labels and column axis labels are:") print(df.axes)
输出结果:
Row axis labels and column axis labels are:
[RangeIndex(start=0, stop=7, step=1), Index([u'Age', u'Name', u'Rating'],
dtype='object')]
dtypes示例
返回每列的数据类型。
import pandas as pd d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack']), 'Age':pd.Series([25,26,25,23,30,29,23]), 'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])} df = pd.DataFrame(d) print ("The data types of each column are:") print(df.dtypes)
输出结果:
The data types of each column are:
Age int64
Name object
Rating float64
dtype: object
empty示例
返回布尔值,表示对象是否为空; 返回True
表示对象为空。
import pandas as pd d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack']), 'Age':pd.Series([25,26,25,23,30,29,23]), 'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])} df = pd.DataFrame(d) print ("Is the object empty?",df.empty)
输出结果:
Is the object empty? False
ndim示例
返回对象的维数。根据定义,DataFrame是一个2D
对象。
import pandas as pd d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack']), 'Age':pd.Series([25,26,25,23,30,29,23]), 'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])} df = pd.DataFrame(d) print ("Our object is:") print(df) print('\n') print ("The dimension of the object is:",df.ndim)
输出结果:
Our object is:
Age Name Rating
0 25 Tom 4.23
1 26 James 3.24
2 25 Ricky 3.98
3 23 Vin 2.56
4 30 Steve 3.20
5 29 Minsu 4.60
6 23 Jack 3.80
The dimension of the object is:2
shape示例
返回表示DataFrame
的维度的元组。 元组(a,b)
,其中a
表示行数,b
表示列数。
import pandas as pd d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack']), 'Age':pd.Series([25,26,25,23,30,29,23]), 'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])} df = pd.DataFrame(d) print ("Our object is:") print(df) print('\n') print ("The shape of the object is:",df.shape)
输出结果:
Our object is:
Age Name Rating
0 25 Tom 4.23
1 26 James 3.24
2 25 Ricky 3.98
3 23 Vin 2.56
4 30 Steve 3.20
5 29 Minsu 4.60
6 23 Jack 3.80
The shape of the object is:(7, 3)
size示例
返回DataFrame中的元素数。
import pandas as pd d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack']), 'Age':pd.Series([25,26,25,23,30,29,23]), 'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])} df = pd.DataFrame(d) print ("Our object is:") print(df) print('\n') print ("The total number of elements in our object is:",df.size)
输出结果:
Our object is:
Age Name Rating
0 25 Tom 4.23
1 26 James 3.24
2 25 Ricky 3.98
3 23 Vin 2.56
4 30 Steve 3.20
5 29 Minsu 4.60
6 23 Jack 3.80
The total number of elements in our object is:21
values示例
将DataFrame
中的实际数据作为ndarray
返回。
import pandas as pd d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack']), 'Age':pd.Series([25,26,25,23,30,29,23]), 'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])} df = pd.DataFrame(d) print ("Our object is:") print(df) print('\n')
print ("The actual data in our data frame is:") print(df.values)
输出结果:
Our object is:
Age Name Rating
0 25 Tom 4.23
1 26 James 3.24
2 25 Ricky 3.98
3 23 Vin 2.56
4 30 Steve 3.20
5 29 Minsu 4.60
6 23 Jack 3.80
The actual data in our data frame is:
[[25 'Tom' 4.23]
[26 'James' 3.24]
[25 'Ricky' 3.98]
[23 'Vin' 2.56]
[30 'Steve' 3.2]
[29 'Minsu' 4.6]
[23 'Jack' 3.8]]
head()和tail()示例
要查看DataFrame对象的小样本,可使用head()
和tail()
方法。
head()
返回前n
行(观察索引值)。显示元素的默认数量为5
,但可以传递自定义数字值。
tail()
返回最后n
行(观察索引值)。显示元素的默认数量为5
,但可以传递自定义数字值。
import pandas as pd d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack']), 'Age':pd.Series([25,26,25,23,30,29,23]), 'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])} df = pd.DataFrame(d) print ("Our data frame is:") print(df) print('\n') print ("The first two rows of the data frame is:") print(df.head(2)) print('\n') print ("The last two rows of the data frame is:") print(df.tail(2))
输出结果:
Our data frame is:
Age Name Rating
0 25 Tom 4.23
1 26 James 3.24
2 25 Ricky 3.98
3 23 Vin 2.56
4 30 Steve 3.20
5 29 Minsu 4.60
6 23 Jack 3.80
The first two rows of the data frame is:
Age Name Rating
0 25 Tom 4.23
1 26 James 3.24
The last two rows of the data frame is:
Age Name Rating
5 29 Minsu 4.6
6 23 Jack 3.8