-
[3-3]만 위트니의 U검정통계 2022. 2. 7. 21:30n [ ]:
# 만 위트니 U검정: 두 모집단의 표본의 갯수가 다를 때 사용 # 두 모집단의 중앙값이 동일한지 여부를 검정In [2]:import numpy as np import pandas as pd from scipy import statsIn [7]:df=pd.read_csv('./data/ch11_training_ind.csv') df1=df[:5].copy() df1Out[7]:A B 0 47 49 1 50 52 2 37 54 3 60 48 4 39 51 In [10]:#값이 작은 순서대로 순위 부여 rank =stats.rankdata(np.concatenate([df1['A'],df1['B']])) rank_df=pd.DataFrame({'A':rank[:5],'B':rank[5:10]}).astype(int) rank_dfOut[10]:A B 0 3 5 1 6 8 2 1 9 3 10 4 4 2 7 In [11]:#u검정의 검정통계량은 A에 관한 순위합에서 A의 크기를 n1로 해서 n1(n1+1)/2을 뺀 것 n1=len(rank_df['A']) u= rank_df['A'].sum()-(n1*(n1+1))/2 uOut[11]:7.0In [12]:rank_df =pd.DataFrame(np.arange(1,11).reshape(2,5).T,columns=['A','B']) rank_dfOut[12]:A B 0 1 6 1 2 7 2 3 8 3 4 9 4 5 10 In [13]:u = rank_df['A'].sum() -(n1*(n1+1))/2 u #a에 좋은 순위가 모여있어서 0, 나쁜 순위가 모여 있으면 값이 커짐Out[13]:0.0In [14]:u,p =stats.mannwhitneyu(df['A'],df['B'],alternative='two-sided') p #귀무가설 채택Out[14]:0.05948611166127324반응형'통계' 카테고리의 다른 글
[선형대수]함수 (0) 2022.06.15 [3-4]카이제곱 검정 (0) 2022.02.07 [3-2] 윌콕슨의 부호순위 검정 (0) 2022.02.07 [3-1]통계적 가설검정 (0) 2022.02.07 [2-1]확률 (0) 2022.02.06