【Pandas DataFrame】pivot_table()関数で、データフレームを特定の列や複数の列に基づいてグループ分けした上で集計することができます。

python

pandasのDataFrameの機能の一つであるpivot_table()関数は、データフレームを特定の列や複数の列に基づいてグループ分けした上で集計することができます。例えば、あるデータフレームには、複数の都市の人口データが含まれているとします。このデータフレームをpivot_table()関数を使用して、都市ごとに人口を集計することができます。

以下のようなデータフレームを考えます。

このデータフレームをpivot_table()関数を使用して、都市ごとに人口を集計するには、以下のようなpythonコードを実行します。

“`pythonimport pandas as pd# データフレームを作成df = pd.DataFrame({‘都市’: [‘東京’, ‘大阪’, ‘名古屋’, ‘東京’, ‘大阪’, ‘名古屋’], ‘人口’: [9000, 5000, 4000, 8500, 6000, 3500]})# pivot_table()関数を使用して、都市ごとに人口を集計df_pivot = df.pivot_table(index=’都市’, values=’人口’, aggfunc=’sum’)# 集計結果を表示print(df_pivot)“`

実行結果は以下のようになります。

“`都市大阪 11000名古屋 7500東京 17500Name: 人口, dtype: int64“`

pivot_table()関数を使用することで、都市ごとに人口を集計することができました。

タイトルとURLをコピーしました