Pythonは、主にデータ中心のライブラリが非常に適しているため、データ分析に非常に適した言語です。パンダはその1つであり、データのインポートと分析を容易にします。この記事では、スタンフォード大学のWebサイトにある公開データセットのCountryData.csvファイルのデータを分析していました。
インストールパンダをインストールします。
pip install pandas
pd.Seriesメソッドを使用して複数のSeriesをDataFrameクラスに渡し、データフレームの作成を完了することにより、PandasでDataFrameを作成します。ここでは、s1を最初の行、s2を2番目の行として、2つのSeriesオブジェクトで渡されます。
例:
出力:
パンダでデータをインポートする
最初のステップは、データを読み取ることです。データはコンマ区切り値またはcsvファイルとして保存されます。各行は改行で区切られ、各列はコンマ(、)で区切られます。Pythonでデータを使用できるようにするには、csvファイルをPandasDataFrameに読み込む必要があります。DataFrameは、テーブルデータを表現および処理する方法です。
例:
import pandas as pd
df = pd.read_csv("IND_data.csv")
df.head()
df.shape
出力:
29,10
パンダでDataFrameにインデックスを付ける
pandas.DataFrame.ilocメソッドを使用してインデックスを作成できます。ilocメソッドを使用すると、場所ごとに最大行と列を取得できます。
例:
df.iloc[0:5,:]
df.iloc[:,:]
df.iloc[5:,:5]
多くの人がPythonを学び、どこから始めればよいのかわかりません。
多くの人がPythonを学び、基本的な文法を習得した後、どこから始めればよいかわかりません。
事例研究を行った多くの人々は、より高度な知識を学ぶ方法を知りません。
したがって、これら3つのタイプの人々のために、ビデオチュートリアル、電子書籍、およびコースのソースコードを無料で受け取ることができる優れた学習プラットフォームを提供します。
QQグループ:721195303
パンダのタグを使用したインデックス作成
pandas.DataFrame.locメソッドを使用してラベルにインデックスを付けることができます。これにより、インデックスの位置の代わりにラベルを使用できます。
例:
df.loc[0:5,:]
df = df.loc[5:,:]
上記の内容は、実際にはdf.iloc [0:5 、:]と大差ありません。これは、行ラベルは任意の値を取ることができますが、行ラベルは位置と正確に一致するためです。ただし、列ラベルを使用すると、データの処理が簡単になります。例:
df.loc[:5,"Time period"]
DataFrameMath与パンダ
データフレームの計算は、パンダツールの統計機能を使用して行うことができます。
例:
df.describe()
df.corr()
df.rank()
パンダ図
これらの例のグラフは、美しいマップを簡単に作成するためのPandasの基本を提供するmatplotlibAPIを参照するための標準的な規則を使用して作成されています。
例:
import the required module
import matplotlib.pyplot as plt
df['Observation Value'].hist(bins=10)
df.boxplot(column='Observation Value', by = 'Time period')
x = df["Observation Value"]
y = df["Time period"]
plt.scatter(x, y, label= "stars", color= "m",
marker= "*", s=30)
plt.xlabel('Observation Value')
plt.ylabel('Time period')
plt.show()
自分で作成したPython学習グループ:721195303を引き続きお勧めします。全員がPythonを学習しています。Pythonを学習したい、または学習している場合は、ぜひ参加してください。誰もがソフトウェア開発パーティーであり、最新のPythonの高度な資料のコピーや、2021年に私が編集したゼロベースの教育など、随時(Pythonソフトウェア開発に関連するもののみ)。高度でPythonに興味のある友人を歓迎します。