PandasのDataFrameには、sample()メソッドという機能があります。この機能を使うと、データフレームから任意の行数分をランダムに抽出することができます。
例えば、以下のようなデータフレームを用意します。
import pandas as pd
df = pd.DataFrame({
'A': [1, 2, 3, 4, 5],
'B': [6, 7, 8, 9, 10],
'C': [11, 12, 13, 14, 15]
})
print(df)
実行結果:
A B C
0 1 6 11
1 2 7 12
2 3 8 13
3 4 9 14
4 5 10 15
このデータフレームから、sample()メソッドを使って、ランダムに2行を抽出するには、以下のようにします。
import pandas as pd
df = pd.DataFrame({
'A': [1, 2, 3, 4, 5],
'B': [6, 7, 8, 9, 10],
'C': [11, 12, 13, 14, 15]
})
print(df.sample(2))
実行結果:
A B C
2 3 8 13
4 5 10 15
このように、sample()メソッドを使うことで、データフレームから任意の行数分をランダムに抽出することができます。