DATALINK

[DATA LEARNING]

A, B, C 지역 한우의 도체중 비교

A, B, C 지역 한우의 도체중 분포
A 지역 한우의 도체중 분포
B 지역 한우의 도체중 분포
C 지역 한우의 도체중 분포
한우 등심지방함량과 설도지방함량
한우 등심지방함량과 설도지방함량의 차이 대응표본 t검정

[Q&A]

지역은 한우가 자란 물리적인 공간을 나타내는 범주의 이름이며 서로 배타적입니다. 집합으로 설명하면, A, B, C는 지역이라는 집합의 부분집합입니다. 따라서 지역은 범주형변수의 이름으로, A, B, C는 범주형변수의 값(데이터)으로 모델링합니다. A, B, C는 지역을 관측한 결과인 범주형데이터입니다.

유전적으로 결정된다면 확률변수로 볼 수 있습니다.

연속형데이터입니다.

범주형데이터입니다

ARTICLE CONTENTS

Comparison of carcass weights of Korean cattle from regions A, B, and C

이승환

Chungnam National University, Daejeon, Republic of Korea

Lee SH. 2024. Comparison of fat content between Korean Hanwoo sirloin and chuck eye roll. Data Science 1:1.

Received: 31 March 2023, Revised: 30 April 2023, Accepted: 04 May 2023, Published: 19 May 2023

ISBN: 979-11-966409-9-6(95490)

DOI: 10.12972/DATALINK.p02-1

Print

Abstract

한우는 지역에 따라 도체중이 다른지 알아보는 연구를 진행하였다. 한우 100마리를 표본으로 하고, 도체중을 확률변수로 하였다. 지역이 다른 한우 100마리를 비교해서 한우는 지역에 따라 도체중이 다르다를 검정하였다. 집단간/집단내분산의 비를 일원분산분석 F검정으로 검정한 결과, 유의미한 차이를 보였다.(p=0.01) 본 연구를 통해 한우는 지역에 따라 도체중이 다르다고 할 수 있다.

Key Word

한우, 도체중, 지역, 일원분산분석, F검정

Modeling

가설

한우는 지역에 따라 도체중이 다르다라는 연구주제로부터, 지역에 따라 분류한 한우의 도체중 모평균과 전체 한우의 도체중 모평균 차이는 0이다라는 귀무가설을 도출하고, 이 가설을 반증하는 지역에 따라 분류한 한우의 도체중 모평균 중 적어도 하나는 전체 한우의 도체중 모평균과 다르다라는 대립가설을 도출한다.

확률변수

도체중(kg)을 확률변수로 한다. 도체중은 한우 도체의 무게로 kg(킬로그램) 단위로 표시한다.

실험설계

한우100마리의 지역과 도체중을 관측하였다. 우리나라에는 다양한 지역에 다양한 방법으로 한우를 생산하는 브랜드들이 있다. 즉, 지역간 브랜드를 통해서 차별성있는 한우를 생산한다고 말할 수 있다. 지역별 한우 씨수소 선발시 도체중을 중시하는 지역이 있고, 근내지방을 선호하는 지역이 존재하여 지역별 도체중의 차이가 있을 수 있다.

Data

데이터수집

한우100마리의 지역과 도체중을 표로 정리하였다.

Table 1. 데이터
1A466
2A406
3A428
4A493
5A460
6A498
7A461
8A405
9A404
10A511
11A355
12A482
13A428
14A435
15A468
16A442
17A502
18A422
19A435
20A411
21A494
22A380
23A340
24A532
25A549
26A445
27A429
28B425
29B421
30B392
31B423
32B429
33B418
34B368
35B357
36B361
37B497
38B445
39B353
40B401
41B459
42B459
43B441
44B447
45B353
46B420
47B346
48B381
49B449
50B359
51B379
52B444
53B463
54B427
55B462
56B359
57B440
58B365
59B493
60B406
61B372
62B412
63B390
64B458
65B434
66B450
67B414
68B507
69B346
70B385
71B469
72B370
73B476
74B433
75B387
76B504
77B422
78B370
79B390
80B379
81B448
82B425
83B346
84B416
85C420
86C421
87C466
88C532
89C412
90C382
91C416
92C461
93C448
94C435
95C394
96C379
97C419
98C442
99C385
100C382

데이터시각화

히스토그램를 그려서, 지역 별 도체중 분포를 탐색하였다.

Data Analysis

가설검정

연구주제 : 한우는 지역에 따라 도체중이 다르다

귀무가설 : 지역에 따라 분류한 한우의 도체중 모평균과 전체 한우의 도체중 모평균 차이는 0이다

귀무가설이 옳다면, 집단간분산과 집단내분산의 비는 확률변수로 확률분포를 F분포로 모델링할 수 있다.

표본을 통해 관측한 검정통계량은 4.76이며, 유의확률은 0.01

만일 유의수준을 0.05로 하면, 유의확률이 유의수준보다 작으므로, 귀무가설 기각

귀무가설이 기각되었으므로 대립가설 채택

검정결과

집단간분산과 집단내분산의 비를 일원분산분석 F검정으로 검정한 결과, 지역별 한우 도체중 평균이 유의미한 차이를 보였다.(p=0.01) 한우는 지역에 따라 도체중이 다르다고 할 수 있다.

Table 2. 데이터분석
분산구분제곱합자유도평균제곱검정통계량유의확률
집단간19501.3429750.674.760.01
집단내198722.66972048.69  
Total218224.0099   

 

Reference

Bhuiyan, et al. 2016. M.S.A.Bhuiyan, D.H.Lee, H.J.Kim, S.H.Lee, S.H.Cho, B.S.Yang, S.D.Kim, S.H.Lee. Estimates of genetic parameters for fatty acid compositions in the longissimus dorsi muscle of Hanwoo cattle. Animal, 12 (2018), pp. 675-683

본인의 Google 계정으로 구글시트를 복사

=AVERAGE(C3:C22) : 평균. C3에서 C22에 있는 모든 데이터의 산술평균.

=VAR.S(C3:C22) : 표본분산. C3에서 C22에 있는 모든 데이터의 표본분산. 각 값과 산술평균과의 차이 제곱을 모두 더한 후, 데이터 개수-1(n-1)로 나눈 값.

=값 혹은 셀^2 : 제곱.

=SUM(J3:J62) : 합. J3에서 J62에 있는 모든 데이터의 합.

=COUNTUNIQUE(B3:B62) : 데이터 개수. B3에서 B62에 있는 데이터 중 중복되지 않는 데이터 개수.

=COUNT(A3:A62) : 데이터 개수. A3에서 A62에 있는 모든 숫자 데이터의 개수. 

=F.DIST.RT(Q3,O3,O4) : 확률밀도. O3와 O4를 자유도로 가지는 F분포 상에서 Q3 우측의 확률밀도를 적분한 값.

=F.INV.RT(U3,O3,O4) : 확률밀도함수의 역함수. O3와 O4를 자유도로 가지는 F분포 상에서 어떤 값을 기준으로 우측의 확률밀도를 적분한 값이 U3가 되는 어떤 값.

=IF(T3>V3,“YES”,“NO”) : 조건문. T3가 V3보다 크면 YES를 표시하고, 그렇지 않으면 NO를 표시함.

=F.DIST(Y3,O3,O4,FALSE) : 확률밀도. O3와 O4를 자유도로 가지는 F분포 상에서 Y3 값이 가지는 확률밀도. FALSE를 TRUE로 변경하면, 누적확률밀도를 계산함.

[DATA LEARNING - 한우품질]

[DATA SCIENCE - 데이터]

[DATA SCIENCE - 모델링]

[DATA SCIENCE - 데이터분석]