【Pandas DataFrame】sample()メソッドで、データフレームから任意の行数分をランダムに抽出することができます。

python

PandasのDataFrameには、sample()メソッドという機能があります。この機能を使うと、データフレームから任意の行数分をランダムに抽出することができます。

例えば、以下のようなデータフレームを用意します。

import pandas as pd
df = pd.DataFrame({
'A': [1, 2, 3, 4, 5],
'B': [6, 7, 8, 9, 10],
'C': [11, 12, 13, 14, 15]
})
print(df)

実行結果:

   A   B   C
0 1 6 11
1 2 7 12
2 3 8 13
3 4 9 14
4 5 10 15

このデータフレームから、sample()メソッドを使って、ランダムに2行を抽出するには、以下のようにします。

import pandas as pd
df = pd.DataFrame({
'A': [1, 2, 3, 4, 5],
'B': [6, 7, 8, 9, 10],
'C': [11, 12, 13, 14, 15]
})
print(df.sample(2))

実行結果:

   A  B   C
2 3 8 13
4 5 10 15

このように、sample()メソッドを使うことで、データフレームから任意の行数分をランダムに抽出することができます。

タイトルとURLをコピーしました