【Pandas DataFrame】interpolate()メソッドで、データフレーム内の欠損値を補完することができます。

python

pandasのDataFrameには、欠損値を補完するためのinterpolate()メソッドがあります。このメソッドは、欠損値を指定した方法で補完することができます。

例えば、以下のようなDataFrameを考えます。

import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3, 4, 5],
'B': [2, 3, 4, None, 6],
'C': [3, 4, None, 6, 7]})
print(df)

実行結果:

   A    B    C
0 1 2.0 3.0
1 2 3.0 4.0
2 3 4.0 NaN
3 4 NaN 6.0
4 5 6.0 7.0

このDataFrameにおいて、欠損値を補完するには、以下のようにinterpolate()メソッドを使用します。

df.interpolate()

実行結果:

   A    B    C
0 1 2.0 3.0
1 2 3.0 4.0
2 3 4.0 5.0
3 4 5.0 6.0
4 5 6.0 7.0

interpolate()メソッドを使用すると、欠損値を指定した方法で補完することができます。デフォルトでは、欠損値を前後の値の平均値で補完します。

タイトルとURLをコピーしました