PandasのDataFrameの機能の一つに、describe()メソッドがあります。このメソッドを使用すると、データフレームの要約統計量を算出することができます。
describe()メソッドは、データフレームの各列について、以下の要約統計量を算出します。
- count:データの個数
- mean:平均値
- std:標準偏差
- min:最小値
- 25%:25パーセンタイル
- 50%:50パーセンタイル
- 75%:75パーセンタイル
- max:最大値
以下のようなデータフレームを例に、describe()メソッドを使用して要約統計量を算出してみましょう。
import pandas as pd
data = {
'name': ['John', 'Paul', 'George', 'Ringo'],
'age': [30, 33, 31, 28]
}
df = pd.DataFrame(data)
df
name age
0 John 30
1 Paul 33
2 George 31
3 Ringo 28
describe()メソッドを使用して要約統計量を算出します。
df.describe()
age
count 4.000000
mean 30.500000
std 2.581989
min 28.000000
25% 28.750000
50% 30.500000
75% 32.250000
max 33.000000
上記のように、describe()メソッドを使用することで、データフレームの要約統計量を算出することができました。