import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
d = np.random.normal(50,10,100)
e = np.random.normal(50,20,100)
df = pd.DataFrame({"data1":d,"data2":e})


df.plot(kind="hist",ec="white",y="data1")

<Axes: ylabel='Frequency'>


df.hist(ec="black")

array([[<Axes: title={'center': 'data1'}>,
        <Axes: title={'center': 'data2'}>]], dtype=object)


f = np.random.normal(50,5,100)
g = np.random.normal(50,30,100)
df2 = pd.DataFrame({"data1":d,"data2":e})


df2.plot(kind="hist",alpha=0.5,ec="black")

<Axes: ylabel='Frequency'>

用語	意味
最小値	データの中で最も小さい値
最大値	データの中で最も大きい値
第一四分位数	データを小さい方から並べて小さい方から25%のところ
中央値	データを小さい方から並べて小さい方から50%のところ
第三四分位数	データを小さい方から並べて小さい方から75%のところ
四分位範囲	第一四分位数 - 第三四分位数
外れ値（大きい方）	第三四分位数 + 1.5×四分位範囲より大きい値
外れ値（小さい方）	第一四分位数 - 1.5×四分位範囲より小さい値

教育データ分析入門（基礎）第1回¶

1.1 授業の目的・到達目標¶

1.2 導入¶

1.3 数学の復習¶

1.3.1 ヒストグラム¶

1.3.2 代表値¶

1.3.3 分散¶

1.3.4 箱ひげ図¶