【python scikit-learn】相関性の分析

python

相関性の分析とは?

相関性の分析とは、2つ以上の変数間の関係を分析するための手法です。相関性の分析を行うことで、2つ以上の変数間の関係を理解し、それらの関係を利用したデータ分析を行うことができます。

scikit-learnを使った相関性の分析

Pythonのscikit-learnを使用すると、相関性の分析を行うことができます。scikit-learnは、機械学習のライブラリであり、Pythonで様々な機械学習アルゴリズムを実装することができます。scikit-learnを使用すると、相関性の分析を行うためのAPIが提供されています。

scikit-learnを使った相関性の分析の例

以下の例では、scikit-learnを使用して、2つの変数間の相関性を分析する方法を示します。

from sklearn.datasets import load_iris
from sklearn.feature_selection import SelectKBest
from sklearn.feature_selection import f_regression
# データセットを読み込む
iris = load_iris()
X = iris.data
y = iris.target
# 特徴量を選択する
selector = SelectKBest(f_regression, k=2)
selector.fit(X, y)
# 特徴量を取得する
X_new = selector.transform(X)
# 相関性を計算する
corr = np.corrcoef(X_new[:, 0], X_new[:, 1])
# 相関係数を表示する
print(corr[0, 1])

上記のコードでは、scikit-learnを使用して、Irisデータセットから2つの特徴量を選択し、それらの特徴量間の相関性を計算しています。最後に、計算された相関係数を表示しています。

scikit-learnを使用することで、簡単に2つ以上の変数間の相関性を分析することができます。

タイトルとURLをコピーしました