# データ
X = [10,15,22,34,33,49,50,50,51,59,69]
Y = [15,22,40,39,30,61,55,48,70,81,60]

# Xの標準得点
# numpyで平均、標準偏差を求め、for文を用いてそれぞれの標準得点を算出
# 標準得点 = (平均値 - 個々の得点) / 標準偏差

# numpyのimport
import numpy as np

# 平均値と標準偏差の算出
x_m = np.average(X)
x_std = np.std(X)

# 計算結果を保存するリストの作成
X_st = []

# それぞれのデータに関して標準得点を計算してX_stに追加
for i in X:
    X_st.append((x_m - i)/x_std)
    
# 結果の表示
X_st

[1.6830039932456407,
 1.4041930907501279,
 1.01385782725641,
 0.34471166126717934,
 0.40047384176628187,
 -0.491721046219359,
 -0.5474832267184616,
 -0.5474832267184616,
 -0.6032454072175641,
 -1.0493428512103846,
 -1.6069646562014102]

# Yも同様に計算
y_m = np.average(Y)
y_std = np.std(Y)

Y_st = []

for i in Y:
    Y_st.append((y_m - i)/x_std)
Y_st

[1.8046669325164102,
 1.4143316690226924,
 0.4106124200388463,
 0.4663746005379488,
 0.9682342250298718,
 -0.7603933704423074,
 -0.42582028744769207,
 -0.035485023953974175,
 -1.2622529949342305,
 -1.8756369804243584,
 -0.7046311899432048]

# Xの偏差値
# 偏差値は標準得点に10倍して50を足した値
# 平均値と標準偏差はすでに算出しているのでそれを利用

# 計算結果を保存するリストの作成
X_T = []

# それぞれのデータに関して偏差値を計算してX_Tに追加
for i in X:
    X_T.append(10 * (x_m - i)/x_std + 50)
    
# 結果の表示
X_T

[66.8300399324564,
 64.04193090750128,
 60.138578272564104,
 53.44711661267179,
 54.00473841766282,
 45.08278953780641,
 44.52516773281538,
 44.52516773281538,
 43.96754592782436,
 39.50657148789615,
 33.9303534379859]

# Yの偏差値も同様に計算

# 計算結果を保存するリストの作成
Y_T = []

# それぞれのデータに関して偏差値を計算してY_Tに追加
for i in Y:
    Y_T.append(10 * (y_m - i)/y_std + 50)
    
# 結果の表示
Y_T

[66.63297183365648,
 63.03539084716337,
 53.784468310466785,
 54.29840845139437,
 58.92386971974266,
 42.99172535098744,
 46.07536619655297,
 49.672947183046084,
 38.36626408263915,
 32.712922532435684,
 43.505665491915025]

# Xの分散
# 個々の値から平均値を引いた値を２乗

x_d = 0

for i in X:
    x_d += (i - x_m)**2

x_var = x_d/len(X)
x_var

321.60330578512395

# Yの分散

y_d = 0

for i in Y:
    y_d += (i - y_m)**2

y_var = y_d/len(Y)
y_var

378.5950413223141

# XとYの共分散

xy = 0

for i,j in zip(X,Y):
    xy += (i - x_m) * (j - y_m)
    
xy_cov = xy / len(X)
xy_cov

306.297520661157

np.cov(X,Y)

array([[353.76363636, 336.92727273],
       [336.92727273, 416.45454545]])

np.cov(X,Y,ddof=0)

array([[321.60330579, 306.29752066],
       [306.29752066, 378.59504132]])

# 相関係数は共分散を(Xの分散×Yの分散)のルートで割ったもの
# ルートはnumpyのsqrt()を使用します。
xy_cov/np.sqrt(x_var * y_var)

0.8778003881596494

第2回の練習問題の解答例¶