교차분석 카이제곱검정
TRAINING DATA SCIENCE 프로그래밍 구글시트 데이터 수집, 시각화, 설명 모델링 확률모델, 새 확률변수, 통계모델, 연구계획 데이터분석 모수추정, 모수비교 표본종류: 대응표본 확률변수가정: 등분산성, 독립성, 정규성 새확률변수: 각 Cell의 표본확률차이의 합 표집분포: 표본카이제곱 중심극한정리 검정확률분포: 카이제곱분포 검정통계량: 표본카이제곱과 표준오차의 비 귀무가설: 유전자형 별 마블링스코어의 확률분포는 같다. 가설검정: 유의확률과 유의수준을 비교 정규분포 $$f(x , ; mu_X, sigma_X^2)=dfrac{1}{sqrt{2pi}sigma_X} mathrm{exp} […]
상관분석 t검정
TRAINING DATA SCIENCE 프로그래밍 구글시트 데이터 수집, 시각화, 설명 모델링 확률모델, 새 확률변수, 통계모델, 연구계획 데이터분석 모수추정, 모수비교 표본종류: 대응표본 확률변수가정: 선형성, 정규성 새확률변수: 상관계수(공분산/표준편차곱) 표집분포: 상관계수 중심극한정리 검정확률분포: t분포 검정통계량: 표본상관계수와 표준오차의 비 귀무가설: 마블링스코어와 등심지방함량의 상관계수는 0 가설검정: 유의확률과 유의수준을 비교 정규분포 $$f(y , ; mu_Y, sigma_Y^2)=dfrac{1}{sqrt{2pi}sigma_Y} mathrm{exp} left(-dfrac{(y-mu_Y)^2}{2sigma_Y^2}right)$$ 여기서, $y$는 정규분포를 나타내는 […]
단순선형회귀분석 F검정
TRAINING DATA SCIENCE 프로그래밍 구글시트 데이터 수집, 시각화, 설명 모델링 확률모델, 새 확률변수, 통계모델, 연구계획 데이터분석 모수추정, 모수비교 표본종류: 대응표본 확률변수가정: 선형성, 등분산성, 독립성, 정규성 새확률변수: 결정계수(공분산제곱과 분산곱의 비) 표집분포: 결정계수 중심극한정리 검정확률분포: F분포 검정통계량: 표본결정계수와 표준오차의 비 귀무가설: 마블링스코어로 설명되는 등심지방함량은 0 가설검정: 유의확률과 유의수준을 비교 정규분포 $$f(y , ; mu_Y, sigma_Y^2)=dfrac{1}{sqrt{2pi}sigma_Y} mathrm{exp} left(-dfrac{(y-mu_Y)^2}{2sigma_Y^2}right)$$ […]
일원분산분석 F검정
TRAINING DATA SCIENCE 프로그래밍 구글시트 데이터 수집, 시각화, 설명 모델링 확률모델, 새 확률변수, 통계모델, 연구계획 데이터분석 모수추정, 모수비교 표본종류: 독립표본(여러 집단) 확률변수가정: 등분산성, 독립성, 정규성 새확률변수: 집단간분산/집단내분산 표집분포: 표본분산 중심극한정리 검정확률분포: F분포 검정통계량: 신호(집단분산)와 노이즈(개체분산)의 비 귀무가설: 도체중의 지역에 의한 신호는 0 가설검정: 유의확률과 유의수준을 비교 정규분포 $$f(y , ; mu_Y, sigma_Y^2)=dfrac{1}{sqrt{2pi}sigma_Y} mathrm{exp} left(-dfrac{(y-mu_Y)^2}{2sigma_Y^2}right)$$ 여기서, […]
독립표본 t검정
TRAINING DATA SCIENCE 프로그래밍 구글시트 데이터 수집, 시각화, 설명 모델링 확률모델, 새 확률변수, 통계모델, 연구계획 데이터분석 모수추정, 모수비교 표본종류: 독립표본(두 집단) 확률변수가정: 등분산성, 독립성, 정규성 새확률변수: 평균차이 표집분포: 표본평균 중심극한정리 검정확률분포: t분포 검정통계량: 평균차이와 표준오차의 비 귀무가설: 등심단면적 평균차이는 0 가설검정: 유의확률과 유의수준을 비교 정규분포 $$f(y , ; mu_Y, sigma_Y^2)=dfrac{1}{sqrt{2pi}sigma_Y} mathrm{exp} left(-dfrac{(y-mu_Y)^2}{2sigma_Y^2}right)$$ 여기서, $y$는 정규분포를 […]
대응표본 t검정
TRAINING DATA SCIENCE 프로그래밍 구글시트 데이터 수집, 시각화, 설명 모델링 확률모델, 새 확률변수, 통계모델, 연구계획 데이터분석 모수추정, 모수비교 스프레드시트: 구글시트 프로그래밍 언어: 파이썬 표본종류: 대응표본 확률변수가정: 등분산성, 독립성, 정규성 새확률변수: 차이평균 표집분포: 표본평균 중심극한정리 검정확률분포: t분포 검정통계량: 차이평균과 표준오차의 비 귀무가설: 지방함량 차이평균은 0 가설검정: 유의확률과 유의수준을 비교 정규분포 구글시트로 정규분포 그리기 파이썬으로 정규분포 그리기 […]
가설검정
모평균 Z검정 : 모평균($mu$)와 주어진 평균($mu_0$)의 비교 – 정규분포 가정 – 모분산을 아는 경우 귀무가설($H_0$) 검정통계량 대립가설($H_1$) 귀무가설 기각역 $$mu=mu_0$$ $$dfrac{bar{X}-mu_0}{dfrac{sigma_X}{sqrt{n}}}$$ $$mugtmu_0$$ $$dfrac{bar{X}-mu_0}{dfrac{sigma_X}{sqrt{n}}}gt z_{alpha}$$ $$multmu_0$$ $$dfrac{bar{X}-mu_0}{dfrac{sigma_X}{sqrt{n}}}lt -z_{alpha}$$ $$muneqmu_0$$ $$left|dfrac{bar{X}-mu_0}{dfrac{sigma_X}{sqrt{n}}}right|gt z_{frac{alpha}{2}}$$ 모분산 카이제곱($chi^2$)검정 : 모분산($sigma^2$)과 주어진 분산($sigma_0^2$)의 비교 – 정규분포 가정 귀무가설($H_0$) 검정통계량 대립가설($H_1$) 귀무가설 기각역 $$sigma^2=sigma^2_0$$ $$(n-1)dfrac{S^2}{sigma_0^2}$$ $$sigma^2gtsigma^2_0$$ $$(n-1)dfrac{S^2}{sigma_0^2}gtchi_{n-1 ; alpha}^2$$ $$sigma^2ltsigma^2_0$$ $$(n-1)dfrac{S^2}{sigma_0^2}ltchi_{n-1 ; alpha}^2$$ […]
분산분석
일원분산분석표 : 한 범주형 원인변수에 의해 집단간분산(신호) 생성, 신호의 비교기준은 집단내분산(노이즈) 변동: 편차제곱합 (Sum of Squared deviations) 자유도 (degree of freedom) 분산: 편차제곱평균 (Mean of Squared deviations) 검정통계량 (test statistic) 집단간(Between) $SS_{B}$ $k-1$ 여기서, $k$는 표본내 집단수 ${MS}_{B}=dfrac{SS_{B}}{k-1}$ 집단간분산(Between variance) $F=dfrac{MS_{B}}{MS_{W}}$ 집단내(Within) $SS_{W}$ $n-k$ 여기서, $n$은 표본크기(표본의 개체수) $k$는 표본내 집단수 $MS_{E}=dfrac{SS_{E}}{n-k}$ 집단내분산(Within variance) […]
변동과 자유도와 분산
표본변동(sample variation)의 구성요소(components of variance) 표본변동의 구성요소 제곱합 표기 다른 표기 영문 개념 $X$변수 편차제곱합 $SS_{X}$$SS_{X}$는 내적(inner product) $SSX$ Sum of Squares for X $X$변수 편차의 제곱의 합 $Y$변수 편차제곱합 $SS_{Y}$$SS_{Y}$는 내적(inner product) $SSY$ Sum of Squares for Y $Y$변수 편차의 제곱의 합 대응된 $X$변수와 $Y$변수의 편차곱합 $SP_{XY}$$SP_{XY}$는 외적(cross product) $SPXY$ Sum of the Products […]
통계
통계 용어 표기 표기 설명 유사 용어 영문 용어 개념 통계량 표본평균: $bar{Y}$ 표본분산: $S^2_Y$ 표본비율: $hat p$ 여기서 $Y$는 확률변수 영 이탤릭 대문자에 바(bar)를 씌움 $bar Y$ 영 이탤릭 대문자 $S^2$ 영 이탤릭 소문자에 모자(hat)을 씌움 $p$ 추정량(estimator) 통계적 특성 (statistical property) 지표(indicator) statistic 표본에서 파생되어 모집단의 특성을 추정하거나 가설을 검정하는 데 사용되는 확률변수 […]