Python机器学习(九十三)Pandas 访问列数据

返回Series

访问DataFrame中的Series,可以使用DataFrame['列名']方式。

# 加载数据
movies_df = pd.read_csv("IMDB-Movie-Data.csv", index_col="Title")
movies_df.columns = ['rank', 'genre', 'description', 'director', 'actors', 'year', 'runtime', 
                     'rating', 'votes', 'revenue_millions', 'metascore']

# 访问列数据
genre_col = movies_df['genre']

type(genre_col)

输出

<class 'pandas.core.series.Series'>

返回的是一个Series。

返回DataFrame

要提取列作为DataFrame,需要传入列名的列表:DataFrame[['列名1', '列名2', ... '列名n']]

在我们的例子中,只有一个列:

genre_col = movies_df[['genre']]

type(genre_col)

输出

<class 'pandas.core.frame.DataFrame'>

可以看到,返回的是一个DataFrame。

添加另一个列:

subset = movies_df[['genre', 'rating']]

subset.head()

输出

                                            genre  rating
Title
Guardians of the Galaxy   Action,Adventure,Sci-Fi     8.1
Prometheus               Adventure,Mystery,Sci-Fi     7.0
Split                             Horror,Thriller     7.3
Sing                      Animation,Comedy,Family     7.2
Suicide Squad            Action,Adventure,Fantasy     6.2

猜你喜欢

转载自www.cnblogs.com/huanghanyu/p/13174136.html