pandasのDataFrameには、duplicated()メソッドという機能があります。この機能は、データフレーム内の各行が重複した行か否かを判定することができます。
例えば、以下のようなデータフレームを考えます。
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3, 4, 5],
'B': [2, 3, 4, 5, 6],
'C': [3, 4, 5, 6, 7]})
print(df)
実行結果:
A B C
0 1 2 3
1 2 3 4
2 3 4 5
3 4 5 6
4 5 6 7
このデータフレームに対して、duplicated()メソッドを使用すると、以下のような結果が得られます。
print(df.duplicated())
実行結果:
0 False
1 False
2 False
3 False
4 False
dtype: bool
この結果から、データフレーム内の各行が重複した行か否かを判定することができます。