DATALINK

[DATA LEARNING]

Y, Y+1년 출생 한우의 등심단면적 비교

2011년, 2012년 출생 한우의 등심단면적
한우 등심지방함량과 설도지방함량
한우 등심지방함량과 설도지방함량의 차이 대응표본 t검정

[Q&A]

2011년, 2012년은 한우의 출생년도를 나타내는 범주의 이름이며 서로 배타적입니다. 집합으로 설명하면, 출생년도라는 집합에서 2011년과 2012년은 부분집합입니다. 그리고 집합의 원소는 한우입니다. 따라서 출생년도는 범주형변수의 이름으로,  2011년과 2012년은 범주형변수의 값(데이터)으로 모델링합니다. 2011년과 2012년은 출생년도를 관측한 결과인 범주형데이터입니다.

유전적으로 결정된다면 확률변수로 볼 수 있습니다.

연속형데이터입니다.

한우의 출생년도는 간격척도가 적용된 이산형데이터입니다. 순서형데이터이지만 한우의 연령은 연속형데이터로 볼 수 있습니다. 한우의 연령은 비율척도가 적용된 데이터입니다.

ARTICLE CONTENTS

Comparison of loin cross-sectional areas of Korean cattle born in year Y and Y+1

이승환

Chungnam National University, Daejeon, Republic of Korea

Lee SH. 2024. Comparison of fat content between Korean Hanwoo sirloin and chuck eye roll. Data Science 1:1.

Received: 31 March 2023, Revised: 30 April 2023, Accepted: 04 May 2023, Published: 19 May 2023

ISBN: 979-11-966409-9-6(95490)

DOI: 10.12972/DATALINK.p02-1

Print

Abstract

출생연도에 따라 한우의 등심단면적이 다른지 알아보는 연구를 진행하였다. 한우 60마리를 표본으로 하고, 등심단면적을 확률변수로 하였다. 2011년과 2012년, 두 출생연도를 가지고, 출생연도에 따라 한우의 등심단면적이 다르다를 검정하였다. 2011-2012 등심단면적 평균 차이를 독립표본 t검정으로 검정한 결과, 유의미한 차이를 보이지 않았다.(p=0.8) 이번 프로젝트를 통해 출생연도에 따라 한우의 등심단면적이 다르다고 할 수는 없다.

Key Word

한우, 등심단면적, 출생년도, 독립표본, t검정

Modeling

가설

출생연도에 따라 한우의 등심단면적이 다르다라는 연구주제로부터, 2011년과 2012년 출생 한우의 등심단면적 모평균 차이는 0이다라는 귀무가설을 도출하고, 이 가설을 반증하는 2011년과 2012년 출생 한우의 등심단면적 모평균 차이는 0이 아니다라는 대립가설을 도출한다.

확률변수

등심단면적(㎠)을 확률변수로 한다. 등심단면적은 등심 단면의 면적으로 ㎠(제곱센티미터) 단위로 표시한다.

실험설계

한우60마리의 출생연도와 등심단면적을 관측하였다. 한우 등심은 구이용으로 선호하는 부위로 다른 부위에 비해 가격이 매우 높다. 따라서, 등심단면적은 한우의 가격에 큰 영향을 주는 중요한 형질이다. 등심단면적이 큰 한우일수록 비싼 가격에 판매된다. 이러한 등심단면적이 한우의 출생연도에 따라 다른지 검정해보기로 하였다.

Data

데이터수집

한우60마리의 출생연도와 등심단면적을 표로 정리하였다.

Table 1. 한우 등심지방함량과 설도지방함량

한우ID출생연도등심단면적(㎠)
1201196
22011102
3201187
4201192
5201192
6201177
7201180
8201186
9201183
10201186
11201190
12201188
13201197
14201173
15201187
16201191
17201184
18201180
19201184
20201194
21201193
22201188
23201194
24201195
25201191
26201183
27201178
28201188
29201176
30201195
31201285
32201293
33201285
34201288
35201290
36201290
37201293
38201294
39201285
40201289
41201296
42201288
43201283
44201282
45201286
46201297
47201294
48201285
49201276
50201290
51201286
52201277
53201284
54201274
55201294
56201290
57201277
58201287
59201290
60201289

데이터시각화

히스토그램를 그려서, 출생연도 별 등심단면적 분포를 탐색하였다.

Data Analysis

가설검정

연구주제 : 출생연도에 따라 한우의 등심단면적이 다르다

귀무가설 : 2011년과 2012년 출생 한우의 등심단면적 모평균 차이는 0이다

귀무가설이 옳다면, 2011-2012 등심단면적 평균 차이는 t분포로 모델링할 수 있다.

표본을 통해 관측한 검정통계량은 0.26이며, 유의확률은 0.8 만일 유의수준을 0.05로 하면, 유의확률이 유의수준보다 크므로, 귀무가설 채택 귀무가설이 채택되었으므로 대립가설 기각

검정결과

2011-2012 등심단면적 평균 차이를 독립표본 t검정으로 검정한 결과, 유의미한 차이를 보이지 않았다.(p=0.8) 출생연도에 따라 한우의 등심단면적이 다르다고 할 수 없다.

Table 2. 한우 등심지방함량과 설도지방함량의 차이 대응표본 t검정

출생연도 표본크기 표본평균 표본분산 표본평균차이 자유도 통합표본분산 표준오차 검정통계량 유의확률
2011 30 87.67 48.16 0.43 58 41.52 1.66 0.26 0.80
2012 30 87.23 34.87

Reference

Bhuiyan, et al. 2016. M.S.A.Bhuiyan, D.H.Lee, H.J.Kim, S.H.Lee, S.H.Cho, B.S.Yang, S.D.Kim, S.H.Lee. Estimates of genetic parameters for fatty acid compositions in the longissimus dorsi muscle of Hanwoo cattle. Animal, 12 (2018), pp. 675-683

본인의 Google 계정으로 구글시트를 복사

=COUNT(C3:C22) : 데이터 개수. C3에서 C22에 있는 숫자로 표시된 데이터의 개수.

=AVERAGE(C3:C22) : 평균. C3에서 C22에 있는 데이터의 평균. 데이터를 모두 더한 후, 데이터 개수로 나눔. 산술평균.

=VAR.S(C3:C22) : 표본분산. C3에서 C22에 있는 데이터의 표본분산. 편차제곱합을 데이터 개수 -1로 나눔.

=STDEV.S(C3:C22) : 표본표준편차. C3에서 C22에 있는 데이터의 표본표준편차. 표본분산의 제곱근.

=SQRT(S3) : 제곱근. S3 값의 제곱근.

=T.DIST.2T(V3,W3) : 확률밀도. t분포 상에서 확률변수의 양측 확률밀도. V3 확률변수에 대해 W3를 자유도로 하는 t분포 상에서의 양측 확률밀도를 계산해서 구함.

=T.INV(1-(AA3/AB3),W3) : 확률변수. 확률밀도에 해당하는 확률변수를 구함. W3를 자유도로 하는 t분포 상에서 1-(AA3/AB3)의 누적확률밀도로 하는 확률변수 값을 표시함.

=IF(Z3>AC3,”YES”,”NO”) : 조건문. Z3의 값이 AC3보다 크면 YES를 표시하고, 그렇지 않으면 NO를 표시함.

=T.DIST(AF3,W3,FALSE) : 확률밀도. W3를 자유도로 하는 t분포 상에서 AF3 확률변수의 확률밀도. FALSE 대신 TRUE를 입력하면 누적확률밀도를 계산함.

[DATA LEARNING - 한우품질]

[DATA SCIENCE - 데이터]

[DATA SCIENCE - 모델링]

[DATA SCIENCE - 데이터분석]