구글시트
수집, 시각화, 설명
확률모델, 새 확률변수, 통계모델, 연구계획
모수추정, 모수비교
확률변수가정: 등분산성, 독립성, 정규성
표집분포: 표본분산 중심극한정리
검정통계량: 신호(집단분산)와 노이즈(개체분산)의 비
가설검정: 유의확률과 유의수준을 비교
$$f(y \, ; \mu_Y, \sigma_Y^2)=\dfrac{1}{\sqrt{2\pi}\sigma_Y} \mathrm{exp} \left(-\dfrac{(y-\mu_Y)^2}{2\sigma_Y^2}\right)$$
여기서, $y$는 정규분포를 나타내는 확률변수, $Y$의 값(변량)
$\mu_Y$는 확률변수, $Y$의 기대값: 집단의 모평균
$\sigma_Y^2$는 확률변수, $Y$의 모분산: 집단의 모분산
$$\chi^2= Z_1^2 + Z_2^2 + \cdots = \sum\limits_{i=1}^{k}Z_{i}^2$$
여기서, $Z_i$는 표준정규분포 확률변수
$k$는 자유도: 표준정규분포 확률변수 개수
$$f(x \, ; k)=\dfrac{1}{2^{\frac{k}{2}}\Gamma\left(\frac{k}{2}\right)}x^{\frac{k}{2}-1}e^{-\frac{x}{2}}$$
여기서, $x$는 카이제곱분포를 나타내는 확률변수의 값(변량)
$k$는 자유도: $Z^2$의 개수
$$F = \dfrac{\frac{\chi^2_1}{df_1}}{\frac{\chi^2_2}{df_2}}$$
여기서, $F$는 F분포를 나타내는 확률변수
$\chi^2_1$과 $\chi^2_2$는 카이제곱분포를 나타내는 확률변수
$df_1$과 $df_2$는 $\chi^2_1$과 $\chi^2_2$가 나타내는 카이제곱분포의 자유도
$$f(x; df_1, df_2) = \frac{\left(\dfrac{df_1}{df_2}\right)^{\frac{df_1}{2}} x^{\frac{df_1}{2} – 1} \left(1 + \frac{df_1}{df_2}x\right)^{-\frac{df_1 + df_2}{2}}}{B\left(\frac{df_1}{2}, \frac{df_2}{2}\right)}
$$
여기서, $x$는 F분포를 나타내는 확률변수의 값(변량)
$df_1$과 $df_2$는 분자와 분모의 카이제곱분포의 자유도
$B(\,\,)$는 베타함수
$B(\frac{df_1}{2}, \frac{df_2}{2}) = \frac{\Gamma(\frac{df_1}{2}) \Gamma(\frac{df_2}{2})}{\Gamma(\frac{df_1}{2} + \frac{df_2}{2})}$
$\Gamma(\,\,)$는 감마함수
$$SS_{Sample} =n \cdot{\bar y}^2+SS_{T}$$
여기서, $SS_{Sample}$는 0을 기준으로하는 표본의 변동
$\bar{y}$는 표본평균: bias
$n$은 표본크기
$SS_{T}$는 표본평균을 기준으로 하는 표본내 변동
$$SS_{T} =SS_{B}+SS_{W}$$
여기서, $SS_{T}$는 표본평균 기준의 개체의 변동: 전체변동
$SS_{B}$는 표본평균 기준의 집단의 변동: 집단간변동
$SS_{W}$는 집단평균 기준의 개체의 변동: 집단내변동
$$df_{T} =df_{B}+df_{W}$$
$$(n-1) =(k-1)+(n-k)$$
여기서, $df_{T}$는 표본의 자유도: $n-1$
$df_{B}$는 표본내 집단의 자유도: $k-1$
$df_{W}$는 표본내 개체의 자유도: $n-k$
$n$은 표본크기: 표본내 개체의 수
$k$는 집단의 수: 표본내 집단의 수
$$SS_T= \sum\limits_{j=1}^{k}\sum\limits_{i=1}^{n_j} (y_{ij} – \bar{y})^2$$
여기서, $SS_T$는 표본평균을 기준으로 하는 표본내 변동
$k$는 집단수
$n_j$는 $j$번째 집단의 표본크기
$y_{ij}$는 확률변수 $Y$의 $j$번째 집단의 $i$번째 값
$\bar y$는 표본평균
$$SS_{B} = \sum\limits_{j=1}^{k} n_j (\bar{y}_j – \bar{y})^2$$
여기서, $SS_{B}$은 표본내 집단간변동
$k$는 집단수
$n_j$는 $j$번째 집단의 표본크기
$\bar {y}_{j}$는 $j$번째 집단의 표본평균
$\bar y$는 표본평균
$$SS_W = \sum_{j=1}^{k} \sum_{i=1}^{n_j} (y_{ij} – \bar{y}_j)^2$$
여기서, $SS_W$는 표본내 집단내변동
$k$는 집단수
$n_j$는 $j$번째 집단의 표본크기: $\sum\limits_{j=1}^{k}n_{k}=n$; $n$은 표본크기
$y_{ij}$는 확률변수 $Y$의 $j$번째 집단의 $i$번째 값
$\bar {y}_{j}$는 $j$번째 집단의 표본평균
$$MS_{B} = \dfrac{SS_B}{k-1}$$
여기서, $MS_{B}$는 집단간분산
$SS_{B}$는 집단간변동
$k$는 표본내 집단수
$(k-1)$은 표본내 집단의 자유도: $d_{B}$
$$MS_W = \dfrac{SS_W}{n-k}$$
여기서, $MS_W$는 집단내분산
$SS_W$는 집단내변동
$n$은 표본크기: $n=\sum\limits_{j=1}^{k}n_j$
$k$는 표본내 집단수
$(n-k)$는 표본내 개체의 자유도: $d_{W}$
$$\chi^2_{B}={df_{B}}\dfrac{s_{B}^2}{\sigma_{B}^2}=(k-1)\dfrac{s_{B}^2}{\sigma_{B}^2}$$
여기서, $s_{B}^2$는 표본집단간분산
$\sigma_{B}^2$은 모집단간분산
$df_{B}$는 표본내 집단의 자유도: $df_{B}=k-1$
$k$는 표본내 집단수
$$\chi^2_{W}={df_{W}}\dfrac{s_{W}^2}{\sigma_{W}^2}=(n-k)\dfrac{s_{W}^2}{\sigma_{W}^2}$$
여기서, $s_{W}^2$는 표본집단내분산
$\sigma_{W}^2$은 모집단내분산
$df_{W}$는 표본내 개체의 자유도: $df_{W}=n-k$
$n$은 표본내 개체수
$k$는 표본내 집단수
$$F= \dfrac{\dfrac{\chi^2_{B}}{df_{B}}}{\dfrac{\chi^2_{W}}{df_{W}}}=\dfrac{\dfrac{s_B^2}{\sigma_B^2}}{\dfrac{s_W^2}{\sigma_W^2}}$$
독립동일분포(Independent and Identically Distributed): 실현되기 전 개체의 확률분포의 분산은 같다.
$\rightarrow$ 등분산가정(등분산성): 실현된 모든 집단의 집단내분산은 같다.
모든 집단의 모평균이 같다.
$\rightarrow$ 개체의 변동으로 인한 모집단내분산(모노이즈)과 모집단간분산(모신호)이 등가
$\rightarrow \sigma_W^2=\sigma_B^2$
$$F= \dfrac{\dfrac{\chi^2_{B}}{df_{B}}}{\dfrac{\chi^2_{W}}{df_{W}}}=\dfrac{\dfrac{s_B^2}{\sigma_B^2}}{\dfrac{s_W^2}{\sigma_W^2}}=\dfrac{MS_{B}}{MS_{W}}$$
여기서, $\sigma_{W}^2=\sigma_{B}^2$: 귀무가설
$\sigma_{B}^2$는 모집단간분산
$\sigma_{W}^2$는 모집단내분산
$s_{B}^2$는 표본집단간분산: $s_{B}^2=MS_{B}=\dfrac{SS_{B}}{k-1}$
$k$는 표본내 집단수
$s_{W}^2$는 표본집단내분산: $s_{W}^2=MS_{W}=\dfrac{SS_W}{n-k}$
$n$은 표본크기
귀무가설$(H_0)$ | 검정통계량 | 대립가설$(H_1)$ | 귀무가설 기각역 |
독립된 여러 집단의 모평균($\mu_i$)이 같다. $\mu_{1}=\mu_{2}=\cdots=\mu_{k}=\mu_0$ $\beta_{0,1}=\beta_{0,2}=\cdots=\beta_{0,k}=\beta_0$ 여기서, $\mu_i$는 $i$번째 집단의 모평균 $\beta_{0,i}$는 $i$번째 집단의 모평균 $k$는 표본내 집단의 수 | $F=\dfrac{s_{B}^2}{s_{W}^2}=\dfrac{MS_{B}}{MS_{W}}$ | 적어도 한 $\mu_{i}$는 $\mu_0$보다 크다. 적어도 한 $\beta_{0,i}$는 $\beta_0$보다 크다. | 검정통계량으로 한 $\mu_{i}$가 $\mu_0$보다 큰 지 알 수 없다. 검정통계량으로 한 $\beta_{0,i}$가 $\beta_0$보다 큰 지 알 수 없다. |
적어도 한 $\mu_{i}$는 $\mu_0$보다 작다. 적어도 한 $\beta_{0,i}$는 $\beta_0$보다 작다. | 검정통계량으로 $\mu_{i}$가 $\mu_0$보다 작은 지 알 수 없다. 검정통계량으로 한 $\beta_{0,i}$가 $\beta_0$보다 작은 지 알 수 없다. | ||
적어도 한 $\mu_{i}$는 $\mu_0$이 아니다. 적어도 한 $\beta_{0,i}$는 $\beta_0$이 아니다. | $F>F_{k-1,\ n-k\ ;\ \alpha}$ 여기서, $k$는 표본내 집단의 수 $n$은 표본내 개체의 수: 표본크기 $\alpha$는 유의수준 |