Learning DATALINK

[LEARNING]

Y, Y+1년 출생 한우의 등심단면적 비교

2011년, 2012년 출생 한우의 등심단면적

[QA]

2011년, 2012년은 한우의 출생년도를 나타내는 범주의 이름이며 서로 배타적입니다. 집합으로 설명하면, 출생년도라는 집합에서 2011년과 2012년은 부분집합입니다. 그리고 집합의 원소는 한우입니다. 따라서 출생년도는 범주형변수의 이름으로,  2011년과 2012년은 범주형변수의 값(데이터)으로 모델링합니다. 2011년과 2012년은 출생년도를 관측한 결과인 범주형데이터입니다.

유전적으로 결정된다면 확률변수로 볼 수 있습니다.

연속형데이터입니다.

한우의 출생년도는 간격척도가 적용된 이산형데이터입니다. 순서형데이터이지만 한우의 연령은 연속형데이터로 볼 수 있습니다. 한우의 연령은 비율척도가 적용된 데이터입니다.

4분위는 4개의 범주를 의미하는 데 4분위수는 4개 범주의 경계의 위치를 나타내는 수입니다. 따라서 4분위는 경계가 3개이므로 각각  1사분위수, 2사분위수, 3사분위수로 표현합니다. 여기서 2사분위수는 중앙값을 의미합니다. 단, 작은 수의 개체로 이루어진 표본은 4분위로 개체를 나누는 다양한 방법이 있게 됩니다. 따라서 채택한 방법에 따라 3개의 분위수와 중앙값이 달라질 수 있습니다.

ARTICLE CONTENTS

Comparison of ribeye area in Hanwoo born in year Y and year Y+1

Seung Hwan Lee

Chungnam National University, Daejeon, Republic of Korea

Lee SH. 2023. Comparison of ribeye area of Hanwoo born in year Y and Y+1. DataLink, a2-2.

Received: 31 March 2023, Revised: 30 April 2023, Accepted: 04 May 2023, Published: 19 May 2023

ISBN: 979-11-966409-9-6(95490)

DOI: 10.12972/DATALINK.p02-1

요약

한우의 표현형은 개체의 유전과 환경의 효과에 의해서 결정된다(P=G+E). 한우의 유전적 개량을 위하여 국가개량사업을 통하여 후대검정(Progeny testing)으로 매년 새로운 보증씨수소(KPN bulls)를 선발하여 농가에 보급하고 있다. 따라서, 1990년 이래 매년 한우의 개량은 우상향으로 증가하고 있다. 본 연구에서는 출생 연도에 따른 한우의 등심단면적이 다른 지 알아보는 프로젝트를 진행하였다. 이는 한우농가가 매년 유전능력이 서로 다른 보증 씨수소를 사용하고, 아울려 출생연도에 따른 환경의 효과가 다르기 때문에 목표형질(등심단면적)의 표현형이 달라질 것이라고 가정한다. 이러한 가설을 검증하기 위하여 한우 60마리를 표본으로 하고, 등심단면적을 확률변수로 하였다. 2011년과 2012년, 두 출생연도를 가지고, 출생연도에 따라 한우의 등심단면적이 다르다를 검정하였다. 2011-2012 등심단면적 평균 차이를 독립표본 t검정으로 검정한 결과, 유의미한 차이를 보이지 않았다(p=0.8). 이번 프로젝트를 통해 출생연도에 따라 한우의 등심단면적이 다르다고 할 수 없다.

Key Word

한우, 등심단면적, 출생년도, 독립표본, t검정

서론

한우의 등급을 결정하는 요인은 육량등급과 육질등급으로 구분된다. 육량등급은 A, B, 그리고 C 세 등급으로 나누고, 육질등급은 근내지방도에 따라서 1++, 1+, 1, 2 그리고 3, 이렇게 5개 등급으로 나누어진다. 따라서 육량, 육질등급을 조합하여 1++A, 1++B, 1++C부터 3A, 3B, 3C등급까지 총 15개 등급으로 구성된다. 최종 등급에 따라서 한우의 가격이 결정되는 구조를 가지고 있다. 이 중에서 한우 거세우의 육량등급은 다음의 방정식으로 결정된다.

$$\text{한우 거세우 육량등급}= \dfrac{11.06398 – 1.25149 \times \text{등지방두께} + 0.28293 \times \text{등심단면적} + 0.56781 \times 도체중량}{ \text{도체중량}} \times 100$$

여기서, 한우 거세우 육량등급의 단위: 도체중량에 대한 %

등지방두께의 단위: $\text {mm}$

등심단면적의 단위: $\text{cm}^2$

도체중량의 단위: $\text{kg}$

위의 방정식에서 보는 바와 같이 등심단면적(Eye muscle area, EMA)은 육량등급을 결정하는 중요한 목표 형질 중의 하나이다. 따라서 등심단면적은 한우의 가격에 큰 영향을 주는 중요한 형질이다. 목표 형질(Phenotype)은 유전자(Gene, G)에 의해서 결정되기도 하지만 환경(사료효과 및 환경, Environment)효과에 의해서 결정된다. 이 프로젝트에서는 출생연도에 따라 한우의 등심단면적이 차이가 나는 지를 확인하고자 한다. 출생년도(Birth Year)는 환경효과의 하나로, 태어나는 환경에 따라서 개체의 표현형이 얼마나 다른 지를 통계적으로 검정하였다.

모델링

가설

여러가지 환경효과 중에서 출생연도(2개 수준)에 따라 한우의 등심단면적이 다르다라는 연구주제로부터, “2011년과 2012년 출생 한우의 등심단면적 모평균 차이는 0이다”라는 귀무가설을 도출하고, 이 가설을 반증하는 2011년과 2012년 출생 한우의 등심단면적 모평균 차이는 0이 아니다라는 대립가설을 도출한다.

확률변수

등심단면적(㎠)을 확률변수로 한다. 등심단면적은 등심 단면의 면적으로 ㎠(제곱센티미터) 단위로 표시한다. 그리고 등심단면적 확률변수는 연속형 확률변수로서 정규분포한다고 가정한다. 이를 확인하기 위하여 자료의 정규성분석을 수행한다.

실험설계

한우60마리의 출생연도와 등심단면적을 관측하였다. 한우 등심은 구이용으로 선호하는 부위로 다른 부위에 비해 가격이 매우 높다. 따라서, 등심단면적은 한우의 가격에 큰 영향을 주는 중요한 형질이다. 등심단면적이 큰 한우일수록 비싼 가격에 판매된다. 이러한 등심단면적이 한우의 출생연도에 따라 다른지 검정해보기로 하였다.

데이터

동물

본 연구에서 사용한 데이터는 강원도 대관령 한우 브랜드에서 생산된 KPN bull 85마리를 부계로 하는 거세우 1000두의 도체형질 및 육질특성 분석을 통하여 수집되었다. 농촌 진흥청 국립 축산과 학원 (NIAS)의 동물보호 및 이용위원회로부터 사전 승인을 얻었으며, 동물복지에 대한 정해진 지침을 따라 자료를 수집하였다. 거세우 1000두는 사료 공급 및 관리는 대관령 한우 조합의 관행대로 균일한 사양관리를 수행하였고 30개월령에 도축되었다. 동물 사육 시 관리 체계는 한우 거세우의 출생지(3개 지역(평창, 정선 및 영월군, 21개 농장), 태어난 년도(출생년도, 3개 수준), 출생 계절(10개 수준), 도축 동기군(도축시년도, 계절, 도축장 등, 20개 수준)으로 구성되어 있다. 이들 태어난 년도, 출생계절, 도축 동기군 등은 환경효과로 가축의 표현형에 영향을 미친다.

도체 및 육질 특성

도체 중량 (CWT), 등지방 두께(BFT), 등심단면적(EMA) 및 근내지방도(MS)를 포함한 도체 특성에 대한 표현형 데이터를 조사하였고, 도체 중량은 도축 후 24시간 후에 측정되었다. 등지방 두께, 등심단면적, 근내지방도는 도체의12번째와 13번째 갈비뼈 접합부 사이의 단면에서 측정을 통해 기록되었다. 근내지방도 점수는 축산품품질평가원에서 채택한 한우 근내지방기준에 따라 1~9점 척도로 평가되었다.

표본 데이터

총 한우 1,000두를 모집단으로 하여 임의로 추출된 한우 60마리의 출생연도와 등심단면적을 표로 정리하였다. 총 60마리의 자료에 대한 기초통계량을 표 2에 정리하였고, 자료의 요약을 위하여 “순위 기반 사분위수”로 “다섯수치 요약”을 수행하고 평균, 분산, 표준편차로 “중심 및 중심경향 요약”을 수행하였다.

Table 1. 2011년, 2012년 출생 한우의 등심단면적

한우ID출생연도등심단면적(㎠)
1201196
22011102
3201187
4201192
5201192
6201177
7201180
8201186
9201183
10201186
11201190
12201188
13201197
14201173
15201187
16201191
17201184
18201180
19201184
20201194
21201193
22201188
23201194
24201195
25201191
26201183
27201178
28201188
29201176
30201195
31201285
32201293
33201285
34201288
35201290
36201290
37201293
38201294
39201285
40201289
41201296
42201288
43201283
44201282
45201286
46201297
47201294
48201285
49201276
50201290
51201286
52201277
53201284
54201274
55201294
56201290
57201277
58201287
59201290
60201289

Table 2. 2011년, 2012년 출생 한우의 등심단면적 기초통계량

기초통계량통계치
다섯 수치 요약최소값 : 1수치73
1사분위수 : 2수치84
2사분위수(중앙값) : 3수치88
3사분위수: 4수치93
최대값: 5수치102
중심과 중심경향성 요약평균: 중심87.5
분산(편차제곱의 평균): 중심경향성40.9
표준편차(분산의 제곱근): 중심경향성6.4

데이터시각화

자료의 정규성을 확인하기 위하여 표본으로 추출된 60두의 한우 등심단면적 표현형을 히스토그램으로 플롯하여 출생년도 별 등심단면적 분포를 탐색하였다.

Figure 1. 2011년, 2012년 출생 한우의 등심단면적

데이터분석

가설검정

  1. 연구주제 : 출생연도에 따라 한우의 등심단면적이 다르다.

  2. 귀무가설 : 2011년과 2012년 출생 한우의 등심단면적 모평균 차이는 0이다.

  3. 두 집단(2011 vs 2012)의 등심단면적의 평균의 비교는 이미 알려져 있는 t-확률분포를 이용하여 모수적 검정을 수행한다. 두 집단의 평균비교를 위하여 t-분포를 이용해야 하는 이유는 본 교재 확률분포 편 t-분포 유도 내용을 참고하기 바란다.

  4. 표본을 통해 관측한 검정통계량은 0.26이며, 유의확률은 0.8이다.

  5. 만일, 유의수준을 0.05로 하면, 유의확률이 유의수준보다 크므로, 귀무가설을 채택한다.

  6. 귀무가설이 채택되었으므로 대립가설을 기각한다.

검정결과

2011-2012 등심단면적 평균차이를 독립표본 t검정으로 검정한 결과, 유의미한 차이를 보이지 않았다.(p=0.8) 출생연도에 따라 한우의 등심단면적이 다르다고 할 수 없다.

Table 3. 한우 등심지방함량과 설도지방함량의 평균차이 대응표본 t검정

표본내 집단 집단크기집단평균집단분산집단의 평균차이표본내 개체의자유도통합표본분산 집단평균차이의 표준오차검정통계량유의확률
20113087.6748.160.435841.521.660.260.80
20123087.2334.87

결론

본 연구에서 가설 검정한 2011년과 2012년, 두 집단의 등심 단면적 평균 차이를 독립표본 t검정으로 검정한 결과, 통계적으로 유의미한 차이를 보이지 않았다(p=0.8). 이는 출생연도에 따라 한우의 등심 단면적이 다르다고 설정한 대립가설을 기각하고 2011년과 2012년에 태어난 한우의 등심 단면적의 차이는 크지 않다고 결론 내릴 수 있다. 등심 단면적에 영향을 미치는 요인은 다양하다. 유전적 요인, 그리고 환경요인이 있다. 본 연구에서 살펴본 출생년도는 환경요인의 하나로 등심 단면적의 크기에는 크게 작용하지 않는다는 것을 확인하였다. 그러나 출생년도 외에 다른 요인들 즉 계절(봄, 여름, 가을, 겨울), 사료섭취량 등과 같은 다른 환경요인이 등심단면적의 크기에 영향을 미칠 수 있을 것이다.

참고문헌

본인의 Google 계정으로 구글시트를 복사

=COUNT(C3:C22) : 데이터 개수. C3에서 C22에 있는 숫자로 표시된 데이터의 개수.

=AVERAGE(C3:C22) : 평균. C3에서 C22에 있는 데이터의 평균. 데이터를 모두 더한 후, 데이터 개수로 나눔. 산술평균.

=VAR.S(C3:C22) : 표본분산. C3에서 C22에 있는 데이터의 표본분산. 편차제곱합을 데이터 개수 -1로 나눔.

=STDEV.S(C3:C22) : 표본표준편차. C3에서 C22에 있는 데이터의 표본표준편차. 표본분산의 제곱근.

=SQRT(S3) : 제곱근. S3 값의 제곱근.

=T.DIST.2T(V3,W3) : 확률밀도. t분포 상에서 확률변수의 양측 확률밀도. V3 확률변수에 대해 W3를 자유도로 하는 t분포 상에서의 양측 확률밀도를 계산해서 구함.

=T.INV(1-(AA3/AB3),W3) : 확률변수. 확률밀도에 해당하는 확률변수를 구함. W3를 자유도로 하는 t분포 상에서 1-(AA3/AB3)의 누적확률밀도로 하는 확률변수 값을 표시함.

=IF(Z3>AC3,”YES”,”NO”) : 조건문. Z3의 값이 AC3보다 크면 YES를 표시하고, 그렇지 않으면 NO를 표시함.

=T.DIST(AF3,W3,FALSE) : 확률밀도. W3를 자유도로 하는 t분포 상에서 AF3 확률변수의 확률밀도. FALSE 대신 TRUE를 입력하면 누적확률밀도를 계산함.

[추천 ARTICLE]