【Pandas DataFrame】describe()メソッドで、データフレームの要約統計量を算出することができます。

python

PandasのDataFrameの機能の一つに、describe()メソッドがあります。このメソッドを使用すると、データフレームの要約統計量を算出することができます。

describe()メソッドは、データフレームの各列について、以下の要約統計量を算出します。

  • count:データの個数
  • mean:平均値
  • std:標準偏差
  • min:最小値
  • 25%:25パーセンタイル
  • 50%:50パーセンタイル
  • 75%:75パーセンタイル
  • max:最大値

以下のようなデータフレームを例に、describe()メソッドを使用して要約統計量を算出してみましょう。

import pandas as pd
data = {
'name': ['John', 'Paul', 'George', 'Ringo'],
'age': [30, 33, 31, 28]
}
df = pd.DataFrame(data)
df
    name  age
0 John 30
1 Paul 33
2 George 31
3 Ringo 28

describe()メソッドを使用して要約統計量を算出します。

df.describe()
            age
count 4.000000
mean 30.500000
std 2.581989
min 28.000000
25% 28.750000
50% 30.500000
75% 32.250000
max 33.000000

上記のように、describe()メソッドを使用することで、データフレームの要約統計量を算出することができました。

タイトルとURLをコピーしました