pandasのDataFrameのpivot_table()メソッドは、データフレームを二次元の表形式に集計するための機能です。このメソッドを使用すると、データフレームの各行と列を指定して、指定した行と列のデータを集計した表を作成することができます。
例えば、以下のデータフレームを使用して、「都道府県」と「性別」を行と列に指定して、「人口」を集計した表を作成します。
都道府県 | 性別 | 人口 |
---|---|---|
東京都 | 男性 | 1000 |
東京都 | 女性 | 2000 |
大阪府 | 男性 | 3000 |
大阪府 | 女性 | 4000 |
以下のようなpythonコードを書くことで、上記のデータフレームを使用して、「都道府県」と「性別」を行と列に指定して、「人口」を集計した表を作成することができます。
import pandas as pd
# データフレームを作成
df = pd.DataFrame({
'都道府県': ['東京都', '東京都', '大阪府', '大阪府'],
'性別': ['男性', '女性', '男性', '女性'],
'人口': [1000, 2000, 3000, 4000]
})
# pivot_table()メソッドを使用して、集計表を作成
df_pivot = df.pivot_table(index='都道府県', columns='性別', values='人口')
# 集計表を表示
print(df_pivot)
実行結果は以下のようになります。
性別 女性 男性
都道府県
大阪府 4000 3000
東京都 2000 1000