pandasのDataFrameには、cut()関数という機能があります。この機能を使うと、データフレームの各要素を任意の範囲に分割することができます。
例えば、以下のようなデータフレームを考えます。
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3, 4, 5],
'B': [6, 7, 8, 9, 10]})
print(df)
実行結果:
A B
0 1 6
1 2 7
2 3 8
3 4 9
4 5 10
このデータフレームのA列を、以下のような範囲に分割したいとします。
[1, 2]
[3, 4]
[5]
このとき、cut()関数を使うと、以下のようになります。
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3, 4, 5],
'B': [6, 7, 8, 9, 10]})
df['A_cut'] = pd.cut(df['A'], bins=[0, 2, 4, 5], labels=['[1, 2]', '[3, 4]', '[5]'])
print(df)
実行結果:
A B A_cut
0 1 6 [1, 2]
1 2 7 [1, 2]
2 3 8 [3, 4]
3 4 9 [3, 4]
4 5 10 [5]
このように、cut()関数を使うことで、データフレームの各要素を任意の範囲に分割することができます。