Learning DATALINK

데이터

프레임, 시각화, 설명

모델링

연구계획, 확률모델, 통계모델, 실험설계

데이터분석

모수비교

프레임

표본종류, 확률변수 가정

확률모델

새로운 확률변수, 표집

통계모델

검정확률분포, 검정통계량

모수비교

귀무가설, 검정

대응표본: 두 집단

등분산성, 독립성, 정규성

값차이

표본평균 중심극한정리

t분포

차이평균과 오차의 비

지방함량 차이평균은 0

유의확률과 유의수준으로 판정

정규분포

$$f(x \, ; \mu, \sigma^2)=\dfrac{1}{\sqrt{2\pi}\sigma} \mathrm{exp} \left(-\dfrac{(x-\mu)^2}{2\sigma^2}\right)$$

여기서, $x$는 정규분포를 나타내는 확률변수

$\mu$는 정규분포의 평균: 집단의 모평균

$\sigma^2$는 정규분포의 분산: 집단의 모분산

확률변수 t

$$t = \dfrac{Z}{\sqrt{\dfrac{V}  {\nu}}}$$

여기서, $Z$는 표준정규분포를 나타내는 확률변수
$V$는 자유도 $\nu$의 $\chi^2$분포를 나타내는 확률변수
$\nu$는 $V$의 자유도

t분포

$$f(t \, ; \nu)=\dfrac{\Gamma \left({\frac{\nu +1}{2}}\right)}{\sqrt{\nu \pi}\Gamma \left(\dfrac{\nu }{2}\right)}\left(1+\dfrac {t^2}{\nu }\right)^{-\frac{\nu +1}{2}}$$

여기서, $t$는 t분포를 나타내는 확률변수

$\nu$는 자유도

$\Gamma(\,\,)$는 감마함수

단일표본 차이의 확률분포 (귀무가설, 등분산가정)

$$f(d \, ; 0, \sigma_d^2)=\dfrac{1}{\sqrt{2\pi}\sigma_d} \mathrm{exp} \left(-\dfrac{d^2}{2 \sigma_d^2}\right)$$

여기서, $d$는 대응된 두 확률변수값, $x_{i1}$과 $x_{i2}$의 차이: 

$d_i={\rm diff}(x_{i1}-x_{i2})$

$\sigma_d^2$은 $d$의 모분산

$\sigma^2$은 등분산인 두 확률변수의 모분산

단일표본 차이의 분산

$$\sigma^2_{d}=\sigma^2_{(x_{i1}-x_{i2})} = \sigma^2_{x_{i1}} + \sigma^2_{x_{i2}}- 2\sigma_{x_{i1} x_{i2}}$$

여기서, $d$는 대응된 두 확률변수의 값, $x_{i1}$과 $x_{i2}$의 차이: $d_i={\rm diff}(x_{i1}-x_{i2})$

$\sigma^2_{d}$는 확률변수 $d$의 분산

$\sigma^2_{x_{i1}}$는 확률변수 $X_1$의 분산

$\sigma^2_{x_{i2}}$는 확률변수 $X_2$의 분산

$\sigma_{x_{i1} x_{i2}}$는 확률변수 $X_1$과 $X_2$의 공분산

단일표본 t검정의 검정통계량

$$t = \dfrac{\bar{x} – \mu_0}{\dfrac{s}{\sqrt{n}}}$$

여기서, $\bar{x}$는 표본평균
$\mu_0$는 귀무가설로 주어진 모평균: $\mu_0=0$
$s$는 표본표준편차
$n$은 표본크기