통계
-
[2-1]확률통계 2022. 2. 6. 23:49
In [25]: import numpy as np import pandas as pd import matplotlib.pyplot as plt df= pd.read_csv('ch4_scores400.csv') df.head() Out[25]: score 0 76 1 55 2 80 3 80 4 74 In [34]: #scores로 부터 표본 크기 20, 10000개를 복원추출하여 표본평균 실행해보기 np.random.seed(0) sample =[np.random.choice(df.score,20).mean() for _ in range(1000)] plt.hist(sample,bins=100) plt.vlines(70,0,30,color='red') print(np.mean(sample)) plt.sho..
-
[1-2]2차원 데이터통계 2022. 2. 6. 23:35
-공분산: 데이터 간의 양의상관관계 음의 상관관계 여부를 확인하는 것 In [5]: import pandas as pd import numpy as np df = pd.read_csv('ch2_scores_em.csv') df.head() Out[5]: student number english mathematics 0 1 42 65 1 2 69 80 2 3 56 63 3 4 41 63 4 5 57 76 In [13]: #회귀직선 선을 포함한 그래프를 동시에 2개 구역으로 그리기 수행 import matplotlib.pyplot as plt import seaborn as sns fig,ax = plt.subplots(1,2,figsize=(14,6)) sns.regplot(ax=ax[0],x =df.en..
-
[1-1] 변수의 종류통계 2022. 2. 6. 23:30
- 명의 척도: 단순히 분류하기 위한 변수로, 학생번호나 전화번호, 성별 등이 있다. 명의 척도의 목적은 구별하는 것. 예를 들어, 학생 번호 4와 학생번호 8의 대소관계는 의미 없고, 합과 차 등 의미 있는 결과를 얻을 수 없다. - 순서척도: 순서 관계나 대소관계에 의미가 있다. 성적 순위, 설문조사의 만족도 등, 성적 순위에서 8위는 4위보다 낮으므로 대소 관계가 존재한다. 그러나 4등은 8등의 2배라고 주장할 수 없다. - 간격 척도: 대소 관계와 그 차이에도 의미를 두는 변수, 연도나 온도가 있다. 60도씨는 30도씨와 대소 관계가 있고, 그 차이에 해당하는 수치도 의미가 있다. 그러나 60도가 30도씨보다 2배 높은 온도라고 할 수 없다. - 비례 척도: 비례 척도는 대소 관계, 차이, 비, ..