【Pandas DataFrame】groupby()メソッドで、データフレームを特定の列や複数の列に基づいてグループ分けすることができます。

python

PandasのDataFrameのgroupby()メソッドは、特定の列や複数の列に基づいてデータフレームをグループ分けするための機能です。これにより、データを分類して集計したり、特定の列の値を変更したりすることができます。

例えば、以下のデータフレームを使用して、「都道府県」列を基準にグループ分けしてみましょう。

import pandas as pd
df = pd.DataFrame({
'都道府県': ['東京都', '大阪府', '東京都', '埼玉県', '大阪府'],
'市区町村': ['千代田区', '大阪市', '新宿区', '越谷市', '池田市'],
'人口': [1234, 5678, 9012, 3456, 7890]
})
print(df)
    都道府県 市区町村    人口
0 東京都 千代田区 1234
1 大阪府 大阪市 5678
2 東京都 新宿区 9012
3 埼玉県 越谷市 3456
4 大阪府 池田市 7890

groupby()メソッドを使用して、「都道府県」列を基準にグループ分けします。

df_group = df.groupby('都道府県')
print(df_group)
<pandas.core.groupby.generic.DataFrameGroupBy object at 0x7f8f8c3f7f98>

groupby()メソッドを使用すると、DataFrameGroupByオブジェクトが返されます。このオブジェクトを使用して、グループ分けされたデータを取得することができます。

for key, group in df_group:
print(key)
print(group)
東京都
都道府県 市区町村 人口
0 東京都 千代田区 1234
2 東京都 新宿区 9012
大阪府
都道府県 市区町村 人口
1 大阪府 大阪市 5678
4 大阪府 池田市 7890
埼玉県
都道府県 市区町村 人口
3 埼玉県 越谷市 3456

上記のように、groupby()メソッドを使用することで、「都道府県」列を基準にグループ分けされたデータを取得することができました。

タイトルとURLをコピーしました