スケーリングとは、データを特定の範囲に収めることを指します。データをスケーリングすることで、データ間の差異を減らし、モデルの学習を容易にすることができます。scikit-learnでは、データをスケーリングするためのいくつかの方法が提供されています。
scikit-learnでは、標準化と正規化の2つのスケーリング方法が提供されています。標準化は、データの平均を0、標準偏差を1にすることで、データをスケーリングします。正規化は、データを0から1の範囲にスケーリングすることです。
scikit-learnでは、標準化と正規化を行うためのいくつかのクラスが提供されています。例えば、StandardScalerクラスを使用して標準化を行うことができます。以下のコードは、StandardScalerクラスを使用してデータを標準化する方法を示しています。
from sklearn.preprocessing import StandardScaler
# データを読み込む
X = [[1, 2], [3, 4], [5, 6]]
# StandardScalerクラスをインスタンス化
scaler = StandardScaler()
# データを標準化する
scaler.fit(X)
X_scaled = scaler.transform(X)
# 標準化されたデータを表示
print(X_scaled)
出力:
[[-1. -1.]
[ 0. 0.]
[ 1. 1.]]