pandasのDataFrameには、欠損値を補完するためのinterpolate()メソッドがあります。このメソッドは、欠損値を指定した方法で補完することができます。
例えば、以下のようなDataFrameを考えます。
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3, 4, 5],
'B': [2, 3, 4, None, 6],
'C': [3, 4, None, 6, 7]})
print(df)
実行結果:
A B C
0 1 2.0 3.0
1 2 3.0 4.0
2 3 4.0 NaN
3 4 NaN 6.0
4 5 6.0 7.0
このDataFrameにおいて、欠損値を補完するには、以下のようにinterpolate()メソッドを使用します。
df.interpolate()
実行結果:
A B C
0 1 2.0 3.0
1 2 3.0 4.0
2 3 4.0 5.0
3 4 5.0 6.0
4 5 6.0 7.0
interpolate()メソッドを使用すると、欠損値を指定した方法で補完することができます。デフォルトでは、欠損値を前後の値の平均値で補完します。