#変数aに整数の2を代入
a = 2

#変数bに整数の5を代入
b = 5

#変数cにaとbを足したものを代入
c = a + b    

#変数dに少数点以下を含む数値を代入
d = 1.05

#変数eに文字列”Noel”を代入
e = "Noel"

#変数aの型を出力
type(a)

int

x = '1'
y = "6"
z = x + y
z
# 文字列の足し算

'16'

a += b         # aとbを足した結果をaに代入
a -= b         # aからbをひいた結果をaに代入
a *= b         # aにbをかけけた結果をaに代入
a /= b          # aをbでわった結果をaに代入
a **= b         # aのb乗をaに代入

T = (1,2,3,4,5)

# これはエラー
T.append(6)

---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
Cell In[5], line 2
      1 # これはエラー
----> 2 T.append(6)

AttributeError: 'tuple' object has no attribute 'append'

S = set([1,2,2,2,4,4,5])
S

{1, 2, 4, 5}

# 要素を追加する場合
S.add(1)
S

{1, 2, 4, 5}

# ディクショナリの生成
D = {"S001":25,"S002":40,"S003":50}

# 値の取り出し
D["S002"]

40

# 要素の追加
D["S004"] = 90

# keyの取得
D.keys()

dict_keys(['S001', 'S002', 'S003', 'S004'])

# 値の取得
D.values()

dict_values([25, 40, 50, 90])

# 以下のようにすると全ての値が取得できる

for i in D.keys():
    print(D[i])

25
40
50
90

# 両方同時に
for k,v in D.items():
    print(k,v)

# 順番は保持されない

S001 25
S002 40
S003 50
S004 90

# enumerate()m
# 要素の順番と値を返す

L = [10,25,30]

for i, v in enumerate(L):
    print(i,v)

0 10
1 25
2 30

# range関数
#0からn-1の整数列
r = range(5)
list(r)

[0, 1, 2, 3, 4]

# nからm-1の整数列
r = range(5,10)
list(r)

[5, 6, 7, 8, 9]

# nからm-1の公差lの整数列
r = range(1,20,3)
list(r)

[1, 4, 7, 10, 13, 16, 19]

L = []
for i in range(101):
    L.append(i)

print(L)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100]

L = ["pen","apple","grape"]

for i in range(len(L)):
    print(L[i])

pen
apple
grape

L = [[10,44,27,32,56,72,34,90],[19,10,89,61,25,66]]

# 2つの組の平均点の計算

for i in L:
    n = 0
    for j in i:
        n += j
    print(n/len(i))

45.625
45.0

import numpy as np

A = list(map(np.average,L))
A

[np.float64(45.625), np.float64(45.0)]

X = [48,60,29,80,77]

x_m = np.average(X)
x_std = np.std(X)

X_T = []
for i in X:
    X_T.append((i-x_m)/x_std)

X_T

[np.float64(-0.5713086317569043),
 np.float64(0.06347873686187842),
 np.float64(-1.576388632069977),
 np.float64(1.1214576845598496),
 np.float64(0.9627608424051539)]

X_T2 = [(i - np.average(X))/np.std(X) for i in X]
X_T2

[np.float64(-0.5713086317569043),
 np.float64(0.06347873686187842),
 np.float64(-1.576388632069977),
 np.float64(1.1214576845598496),
 np.float64(0.9627608424051539)]

import pandas as pd

df = pd.read_csv("../DATA01/options.csv",index_col=0)
df.head()

ID = df.index
dft = df.T
ANS = [2,3,4,1,3,3,1,1,4,1,4,1,3,1,2]

# 採点
M = []

for i in ID:
    tmp = []
    for j,k in zip(ANS,dft[i]):
        if j == k:
            tmp.append(1)
        else:
            tmp.append(0)
    M.append(tmp)

df_mrkd = pd.DataFrame(index = df.columns)


for i,j in zip(ID,M):
    df_mrkd[i] = j

df_mrkd2 = df_mrkd.T

df_mrkd2.head()

# 選択肢の選択率
N = []

for i in df.columns:
    op1 = len(df[df[i] == 1])/11
    op2 = len(df[df[i] == 2])/11
    op3 = len(df[df[i] == 3])/11
    op4 = len(df[df[i] == 4])/11
    N.append([op1,op2,op3,op4])

df_op = pd.DataFrame(index = [1,2,3,4])

for i,j in zip(df.columns,N):
    df_op[i] = j

df_op2 = df_op.T
df_op2["ANS"] = ANS
df_op2

from numpy.random import randint
randint(6)

2

メソッド	意味
D.update({"S005":20,"S006":10})	ディクショナリとディクショナリを連結
D.pop("S001")	キーを指定して要素を削除。返ってくる値は削除した要素の値
D.clear()	全ての要素の削除
D.has_key("S002")	指定したキーがあるかどうか。返ってくる値はTrue/False

	Q01	Q02	Q03	Q04	Q05	Q06	Q07	Q08	Q09	Q10	Q11	Q12	Q13	Q14	Q15
S001	2	3	4	1	3	3	1	1	4	1	1	1	3	2	3
S002	2	3	4	1	3	3	1	1	4	1	1	1	3	3	2
S003	2	4	4	1	3	3	1	1	4	3	4	4	3	4	4
S004	2	4	4	1	3	3	1	1	1	1	3	1	1	1	1
S005	2	3	4	1	3	3	1	1	4	1	4	3	1	3	2

	Q01	Q02	Q03	Q04	Q05	Q06	Q07	Q08	Q09	Q10	Q11	Q12	Q13	Q14	Q15
S001	1	1	1	1	1	1	1	1	1	1	0	1	1	0	0
S002	1	1	1	1	1	1	1	1	1	1	0	1	1	0	1
S003	1	0	1	1	1	1	1	1	1	0	1	0	1	0	0
S004	1	0	1	1	1	1	1	1	0	1	0	1	0	1	0
S005	1	1	1	1	1	1	1	1	1	1	1	0	0	0	1

	1	2	3	4	ANS
Q01	0.000000	1.000000	0.000000	0.000000	2
Q02	0.000000	0.090909	0.636364	0.272727	3
Q03	0.000000	0.000000	0.000000	1.000000	4
Q04	1.000000	0.000000	0.000000	0.000000	1
Q05	0.000000	0.000000	1.000000	0.000000	3
Q06	0.000000	0.000000	1.000000	0.000000	3
Q07	1.000000	0.000000	0.000000	0.000000	1
Q08	1.000000	0.000000	0.000000	0.000000	1
Q09	0.181818	0.000000	0.090909	0.727273	4
Q10	0.636364	0.000000	0.272727	0.090909	1
Q11	0.272727	0.000000	0.090909	0.636364	4
Q12	0.818182	0.000000	0.090909	0.090909	1
Q13	0.181818	0.000000	0.545455	0.272727	3
Q14	0.272727	0.181818	0.272727	0.272727	1
Q15	0.272727	0.545455	0.090909	0.090909	2

教育データ分析入門 1（第4回）2

4.2 変数とデータの型¶

4.3 データ構造¶

4.3.1 タプル¶

4.3.2 セット¶

4.3.3 ディクショナリ¶

4.4 リストで利用する関数¶

4.4.1 enumerate()¶

4.4.2 range()¶

4.4.3 map()¶

4.4.4 リスト内包表記¶

演習問題¶

練習問題¶