데이터분석 강의

1

보드게임을 이용한 수학적 창의력 향상 프로젝트로 사전, 사후 평균 비교의 결과를 구해가는 과정을 함께 학습해보겠습니다.

2

학습을 마치고 나면, 보드게임 전후의 수학적 창의력 점수를 비교해서, 수학적 창의력이 향상되었음을 검정할 수 있게 됩니다.

3

데이터분석 결과 테이블에 있는 각 값들의 의미를 알게 됩니다

4

7단계의 학습순서입니다

5

데이터의 대표값과 분포값을 구해서 표본통계량으로 정리합니다.

6

표본평균이 나타내는 분포를 살펴보고 표준평균과 모집단의 평균과의 오차인 표준오차를 구합니다

7

사전-사후 두 확률변수 간의 편차로 새로운 확률변수를 모델링합니다.

8

사전 사후 표본으로 대응표본을 만들고 t-검정을 행합니다.

9

데이터분석에 사용된 구글시트 함수 목록입니다.

10

데이터 개수, 평균, 제곱, 제곱근, 표본분산, 표본 표준편차, t 분포 확률밀도함수, t 검정 함수를 사용합니다.

11

대응표본의 수학적 창의력 점수의 편차의 대표값을 알아보겠습니다.

12

대응표본은 사전, 사후 수학적 창의력 점수의 편차가 요소입니다.

13

사전, 사후 점수로 부터 사전 표본의 평균과 사후 평균의 평균을 구합니다. 그리고 대응표본의 평균을 구합니다. 대응표본의 평균을 구하는 방법은 2가지가 있습니다. 사전 사후 평균 차이로 구하는 방법과 대응표본에 직접 계산하는 방법입니다. 이 평균은 사후 검사 점수의 평균(𝜇₁)과 사전 검사 점수의 평균(𝜇₂)의 차이입니다.

14

사전 사후 대응표본의 분포값을 알아 보겠습니다.

15

표본분산을 정의에 의해서 구한 후 표본편차를 구하였습니다. 표본의 분산(Sd²)의 계산은 표본평균을 기준으로 하는 점수편차의 제곱값들을 모두 더한 후 엔 마이너스 일(𝑛-1)로 나눈 것입니다. 여기서 표본의 크기 보다 1이 작은 값으로 나누는 이유는 기준인 평균을 구할 때 자유도 하나를 사용하였기 때문입니다.

16

사전 사후 대응표본의 표본통계량을 알아 보겠습니다.

17

사전 사후 대응표본의 표본통계량을 정리하였습니다.

18

표본통계량은 대표값과 분포값으로 기술하였습니다.

19

확률변수인 표본평균이 나타내는 확률분포를 알아보겠습니다 표본평균이 나타내는 확률분포를 표집분포라고도 합니다

20

표본평균이 나타내는 확률분포의 중심은 모집단의 평균과 같습니다. 표본평균이 나타내는 확률분포의 분산은 모집단의 분산을 표본의 크기로 나눈 값입니다. 모분산을 알 수 없을 때는 표본의 분산으로 대체합니다.

21

중심극한정리에 의하여 표본평균의 분포는 종모양의 확률분포를 나타냅니다. 이때 종모양의 확률분포를 t분포라 하며 표본의 크기에서 일을 뺀 자유도로 모양이 결정됩니다.

22

표준오차는 표본평균이 이루는 확률분포의 표준편차를 알아 보겠습니다.

23

표준오차는 Standard Error의 약자로 SE로 표시하며 180.70으로 구했습니다

24

표본의 크기 n이 커질수록 오차는 작아집니다. 모집단의 평균을 기준으로 사용한다고 해서 편차(deviation)가 아닌 오차(error)로 표현합니다.

25

편차로 새로운 확률변수를 정의합니다. 대응표본의 확률분포를 t분포로 변환합니다.

26

대응표본의 확률분포를 t분포로 변환해주는 변환식을 구해 봅니다.

27

표준오차는 모르는 모분산을 관측한 표본분산으로 대체하여 구합니다.

28

t분포는 수식으로 정의된 확률분포입니다.

29

t분포는 자유도에 따라 모양이 다릅니다. t분포는 자유도가 클수록, 즉, 표본의 크기가 클수록 표준정규분포에 가까워집니다.

30

t분포에서 검정통계량과 유의확률을 구해 봅니다.

31

검정통계량, 𝑡값은 대응표본평균 관측값을 표준오차(SE)로 나눈 것입니다.

32

수학적 창의력 편차의 관찰값 665.13점은 t분포에서의 검정통계량 3.68로 변환되었습니다.

33

t값은 t분포의 확률을 둘로 나누는데 평균과 다른 편에 있는 확률이 유의확률입니다.

34

구글시트 함수를 사용하여 유의확률은 0.002 즉, 02%로 계산되었습니다.

35

유의수준을 정해 보도록 하겠습니다. 유의수준은 가설의 채택과 기각의 근거가 되는 확률입니다. 유의수준은 그 분야의 전문가가 정하거나 축적된 정보로 부터 결정하게 됩니다.

36

수학적 창의력은 변하지 않는다 라는 가설을 95%로 신뢰한다면 유의수준은 5% 즉. 0.05 입니다.

37

검정통계량은 양수이므로 수학적 창의력은 향상되는 것으로 검정할 수 있습니다.

38

구해놓은 유의확률이 유의수준보다 작으므로 귀무가설은 기각될 것입니다.

39

대응표본 t검정을 통한 연구가설 검정과정입니다.

40

연구가설은 보드게임은 수학적 창의력을 향상시킨다 입니다.

41

귀무가설은 보드게임 전후의 수학적 창의력 점수 차이는 0이다 입니다. 즉, 수학적 창의력은 변하지 않는다 입니다.

42

귀무가설이 옳고, 수학적 창의력의 편차를 확률변수로 한다면 t분포로 모델링합니다

43

표본을 통해 관측한 검정통계량은 수학적 창의력이 향상됨을 나타내는 양의수 3.68이며 유의확률은 0.002입니다.

44

유의수준을 5%라 하면 유의확률은 유의수준보다 작으므로 귀무가설은 기각됩니다.

45

검정통계량이 양수이므로 수학적 창의력은 향상되었고 귀무가설이 기각되었으므로 연구가설을 채책할 수 있습니다. 대응표본 t검정을 통해 보드게임은 수학적 창의력을 향상시킨다라고 95%의 신뢰로 말할 수 있게 되었습니다.

46

감사합니다

강의 자료