Learning DATALINK

[LEARNING]

A, B, C 지역 한우의 도체중 비교

한우의 도체중 분포
A 지역 한우의 도체중 분포
B 지역 한우의 도체중 분포
C 지역 한우의 도체중 분포

[QA]

지역은 한우가 자란 물리적인 공간을 나타내는 범주의 이름이며 서로 배타적입니다. 집합으로 설명하면, A, B, C는 지역이라는 집합의 부분집합입니다. 따라서 지역은 범주형변수의 이름으로, A, B, C는 범주형변수의 값(데이터)으로 모델링합니다. A, B, C는 지역을 관측한 결과인 범주형데이터입니다.

유전적으로 결정된다면 확률변수로 볼 수 있습니다.

연속형데이터입니다.

범주형데이터입니다

ARTICLE CONTENTS

Comparison of carcass weights of Korean cattle from regions A, B, and C

이승환

Chungnam National University, Daejeon, Republic of Korea

Lee SH. 2024. Comparison of fat content between Korean Hanwoo sirloin and chuck eye roll. Data Science 1:1.

Received: 31 March 2023, Revised: 30 April 2023, Accepted: 04 May 2023, Published: 19 May 2023

ISBN: 979-11-966409-9-6(95490)

DOI: 10.12972/DATALINK.p02-1

Print

요약

한우의 개량은 국가개량사업에서 후대검정(progeny testing) 방법을 이용하여 보증 씨수소를 선발하여 전국 농가에 우량 씨수소의 정액(semen)을 보급하고 있고, 각 지자체별로 암소의 유전적 개량을 진행하고 있다. 암소의 유전적 개량의 주요 목표형질은 도체중(carcass weight), 등심단면적(Eye muscle area), 등지방두께(backfat thickness) 및 근내지방도(marbling score)이다. 국내 각 지자체의 암소개량의 의지에 따라서 지자체(지역)별로 암소의 유전능력이 서로 상이하게 다를 것이다. 따라서, 본 연구프로젝트에서는 각 지자체(지역)별로 개량의 목표형질인 도체중(carcass weight, kg)이 다른지 알아보는 프로젝트를 진행하였다. 한우 100마리를 표본으로 하고, 도체중을 확률변수로 하였다. 지역이 다른 한우 100마리를 비교해서 한우는 지역에 따라 도체중이 다르다를 검정하였다. 집단간/집단내분산의 비를 일원분산분석 F검정으로 검정한 결과, 유의미한 차이를 보였다.(p=0.01) 이번 프로젝트를 통해 한우는 지역에 따라 도체중이 다르다고 할 수 있다.

Key Word

한우, 도체중, 지역, 일원분산분석, F검정

서론

한우의 개량은 국가개량사업에서 후대검정(progeny testing) 방법을 이용하여 보증 씨수소를 선발하여 전국 농가에 우량 씨수소의 정액(semen)을 보급하고 있고, 각 지자체별로 암소의 유전적 개량을 진행하고 있다. 따라서 지자체(지역)별로 암소의 유전능력이 서로 다를 것이다. 더욱이 우리나라에는 다양한 지역에 다양한 사육방법으로 한우를 생산하는 브랜드들이 존재한다. 이러한 암소의 유전능력의 차이 및 브랜드들의 소 사육방식에 따라서 한우의 도체중이 얼마나 다른지를 검정하였다.

모델링

가설

한우는 지역에 따라 도체중이 다르다라는 연구주제로부터, 지역에 따라 분류한 한우의 도체중 모평균과 전체 한우의 도체중 모평균 차이는 0이다라는 귀무가설을 도출하고, 이 가설을 반증하는 지역에 따라 분류한 한우의 도체중 모평균 중 적어도 하나는 전체 한우의 도체중 모평균과 다르다라는 대립가설을 도출한다.

확률변수

도체중(kg)을 확률변수로 한다. 도체중은 한우 도체의 무게로 kg(킬로그램) 단위로 표시한다.

실험설계

한우100마리의 지역과 도체중을 관측하였다. 우리나라에는 다양한 지역에 다양한 방법으로 한우를 생산하는 브랜드들이 있다. 즉, 지역간 브랜드를 통해서 차별성있는 한우를 생산한다고 말할 수 있다. 지역별 한우 씨수소 선발시 도체중을 중시하는 지역이 있고, 근내지방을 선호하는 지역이 존재하여 지역별 도체중의 차이가 있을 수 있다.

데이터

데이터수집

한우100마리의 지역과 도체중을 표로 정리하였다.

Table 1. 한우의 지역별 도체중

한우 ID지역도체중 (kg)
1A466
2A406
3A428
4A493
5A460
6A498
7A461
8A405
9A404
10A511
11A355
12A482
13A428
14A435
15A468
16A442
17A502
18A422
19A435
20A411
21A494
22A380
23A340
24A532
25A549
26A445
27A429
28B425
29B421
30B392
31B423
32B429
33B418
34B368
35B357
36B361
37B497
38B445
39B353
40B401
41B459
42B459
43B441
44B447
45B353
46B420
47B346
48B381
49B449
50B359
51B379
52B444
53B463
54B427
55B462
56B359
57B440
58B365
59B493
60B406
61B372
62B412
63B390
64B458
65B434
66B450
67B414
68B507
69B346
70B385
71B469
72B370
73B476
74B433
75B387
76B504
77B422
78B370
79B390
80B379
81B448
82B425
83B346
84B416
85C420
86C421
87C466
88C532
89C412
90C382
91C416
92C461
93C448
94C435
95C394
96C379
97C419
98C442
99C385
100C382

데이터시각화

히스토그램를 그려서, 지역 별 도체중 분포를 탐색하였다.

Figure 1. 한우의 도체중 분포

Figure 2. A지역 한우의 도체중 분포

Figure 3. B지역 한우의 도체중 분포

Figure 4. C지역 한우의 도체중 분포

데이터분석

가설검정

  1. 연구주제 : 한우는 지역에 따라 도체중이 다르다
  2. 귀무가설 : 지역에 따라 분류한 한우의 도체중 모평균과 전체 한우의 도체중 모평균 차이는 0이다
  3. 귀무가설이 옳다면, 집단간분산과 집단내분산의 비는 확률변수로 확률분포를 F분포로 가설검정할 수 있다.
  4. 표본을 통해 관측한 검정통계량은 4.76이며, 유의확률은 0.01
  5. 만일 유의수준을 0.05로 하면, 유의확률이 유의수준보다 작으므로, 귀무가설 기각
  6. 귀무가설이 기각되었으므로 대립가설 채택

검정결과

집단간분산과 집단내분산의 비를 일원분산분석 F검정으로 검정한 결과, 지역별 한우 도체중 평균이 유의미한 차이를 보였다.(p=0.01) 한우는 지역에 따라 도체중이 다르다고 할 수 있다.

Table 2. 지역별 한우 도체중 평균 비교 : 일원분산분석 F검정

분산구분제곱합자유도평균제곱검정통계량유의확률
집단간19501.3429750.674.760.01
집단내198722.66972048.69  
Total218224.0099   

결론

집단간분산과 집단내분산의 비를 일원분산분석 F검정으로 검정한 결과, 지역별 한우 도체중 평균이 유의미한 차이를 보였다.(p=0.01) 한우는 지역에 따라 도체중이 다르다고 할 수 있다.

참고문헌

Bhuiyan, et al. 2016. M.S.A.Bhuiyan, D.H.Lee, H.J.Kim, S.H.Lee, S.H.Cho, B.S.Yang, S.D.Kim, S.H.Lee. Estimates of genetic parameters for fatty acid compositions in the longissimus dorsi muscle of Hanwoo cattle. Animal, 12 (2018), pp. 675-683

본인의 Google 계정으로 구글시트를 복사

=AVERAGE(C3:C22) : 평균. C3에서 C22에 있는 모든 데이터의 산술평균.

=VAR.S(C3:C22) : 표본분산. C3에서 C22에 있는 모든 데이터의 표본분산. 각 값과 산술평균과의 차이 제곱을 모두 더한 후, 데이터 개수-1(n-1)로 나눈 값.

=값 혹은 셀^2 : 제곱.

=SUM(J3:J62) : 합. J3에서 J62에 있는 모든 데이터의 합.

=COUNTUNIQUE(B3:B62) : 데이터 개수. B3에서 B62에 있는 데이터 중 중복되지 않는 데이터 개수.

=COUNT(A3:A62) : 데이터 개수. A3에서 A62에 있는 모든 숫자 데이터의 개수. 

=F.DIST.RT(Q3,O3,O4) : 확률밀도. O3와 O4를 자유도로 가지는 F분포 상에서 Q3 우측의 확률밀도를 적분한 값.

=F.INV.RT(U3,O3,O4) : 확률밀도함수의 역함수. O3와 O4를 자유도로 가지는 F분포 상에서 어떤 값을 기준으로 우측의 확률밀도를 적분한 값이 U3가 되는 어떤 값.

=IF(T3>V3,“YES”,“NO”) : 조건문. T3가 V3보다 크면 YES를 표시하고, 그렇지 않으면 NO를 표시함.

=F.DIST(Y3,O3,O4,FALSE) : 확률밀도. O3와 O4를 자유도로 가지는 F분포 상에서 Y3 값이 가지는 확률밀도. FALSE를 TRUE로 변경하면, 누적확률밀도를 계산함.

[Related ARTICLE]

[EBOOK - 한우의 품질]

[DATA SCIENCE - 데이터분석]