多項式特徴量とは?
多項式特徴量とは、データセット内の特徴量を多項式関数で表現する手法です。多項式特徴量を使用すると、データセット内の特徴量をより複雑な関数で表現することができます。これにより、モデルの予測性能を向上させることができます。
scikit-learnでの多項式特徴量
scikit-learnでは、多項式特徴量を抽出するためのPolynomialFeaturesクラスを提供しています。このクラスを使用すると、データセット内の特徴量を多項式関数で表現することができます。
scikit-learnのPolynomialFeaturesクラスの使用例
以下の例では、scikit-learnのPolynomialFeaturesクラスを使用して、データセット内の特徴量を2次多項式関数で表現しています。
from sklearn.preprocessing import PolynomialFeatures
# データセットを作成
X = [[1, 2], [3, 4]]
# PolynomialFeaturesクラスをインスタンス化
poly = PolynomialFeatures(degree=2)
# データセットを2次多項式関数で表現
X_poly = poly.fit_transform(X)
# 結果を表示
print(X_poly)
[[ 1. 1. 2. 1. 2. 4.]
[ 1. 3. 4. 9. 12. 16.]]
上記のコードを実行すると、元のデータセットを2次多項式関数で表現した結果が表示されます。