카테고리 없음

기본 통계 2. 기술통계 - 산포

Notbee 2024. 2. 22. 22:04

기본 통계 2. 기술통계 - 산포

통계적 사고와 관련된 글에서 언급하였듯이, 모든 데이터는 산포를 갖는다. 지난 시간에는 다양한 대표값 종류를 확인하였고, JMP 프로그램을 활용하여 분석하는 법을 보았다. 해당 글을 따라 수행하면 사실, 그 밑에 원하는 항목을 체크하기만 하면 산포 관련 값을 얻어낼 수 있다.

 

https://notbee.tistory.com/72

 

기본 통계 2. 기술통계 - 대표값

기본 통계 2. 기술통계 - 대표값 지난 시간에는 기술통계를 수행하기 전에 앞서 데이터 품질 체크 및 정규성 검정을 수행하는 법을 정리하였다. 오늘은 기술통계 중 대표값을 얻어내는 작업을 해

notbee.tistory.com

 

프로그램으로 실습하기 전 분산(Variance), 표준편차 (Standard Deviation), 범위 (Range), 사분위수 (Quartile), 변동계수 (Coefficient of Variance) 등에 관해 간략히 설명하고자 한다. 이 값들은 데이터가 평균으로부터 얼마나 떨어져있는지 확인하기 위한 값들이다.

 

 

우선, 평균에서 데이터를 뺀 편차들은 더하면 0이 될 것이다. 따라서 각 편차들을 제곱하여 더한 후 n-1로 나눠준 값이 바로 표본분산이다. 표준편차는 분산에 제곱근을 취하여 얻는다.

 

 

범위는 최대값 - 최소값으로써, 극단값이 있을 시 불안정하기 때문에 많이 쓰이는 값은 아니다.

 

사분위수는 측정값을 순서대로 정렬하여 4등분 하는 수이다.

Q1: 제 1 사분위수 = 25%

Q2: 제 2 사분위수 = 50 % (중앙값)

Q3: 제 3 사분위수 = 75 %

 

Q1 ~ Q3에 해당하는 25 ~ 75%는 사분위 범위 (IQR, Interquartile Range)라고도 한다.

 

변동 계수는 상대 표준 편차라고도 불리며, 표준 편차 (Standard Deviation)를 평균 (Average)으로 나눈 것이다. (https://notbee.tistory.com/45)

 

변동 계수 (CV, Coefficient of Variation) 개념, 계산, 적용

변동 계수는 상대 표준 편차라고도 불리며, 표준 편차 (Standard Deviation)를 평균 (Average)으로 나눈 것이다. 더보기 변동 계수 = 표준 편차 / 평균 Excel에서 쉽게 구현 할 수 있다. 값 V에 대하여 다음과

notbee.tistory.com

 

위 항목들은 모두 JMP를 통해 간단히 확인 할 수 있다.

 

1. 지난 정규성 검정 글을 참고하여 정규성 검정을 수행한다.

https://notbee.tistory.com/71

 

기본 통계 2. 기술통계 - 정규성 검정

기본 통계 2. 기술통계 - 정규성 검정 정규분포(Normal Distribution)는 종 모양의 좌우대칭 그래프이다. 영어 단어에서 알 수 있듯이 자연스러운, 정상의, 표준의 뜻을 가지고 있으며 데이터가 자연스

notbee.tistory.com

 

 

2. p-value가 0.05 이상이므로 해당 데이터 세트는 정규분포를 따른다고 가정할 수 있다.

2

 

 

3. Summary Statistics 핫스팟 - Customize Summary Statistics를 클릭한다.

 

3

 

4. Variance, CV, Range 등 관련 항목을 체크한다.

4

 

5. 결과는 다음과 같다.

- 위의 Quartile 항목에서 각 사분위 값을 확인할 수 있으며, 최대값과 최소값 역시 알 수 있다.

- 아래 Summary Statistics에서 표준편차, 분산, CV, Range를 확인 할 수 있다.

5

 

Distribution의 최상단에 그래프와 더불어 Box Plot을 확인할 수 있다. 이 Box Plot을 통해서도 데이터의 산포를 어느정도 가늠할 수 있다. 하지만 표본 개수가 적을 시에는 그냥 그래프를 확인하는 것이 좋다.

 

Box Plot 설명

 

 

https://notbee.tistory.com/69

 

기본 통계 0. 목차

0. 목차 1. Intro - 생명공학 전공자가 통계를 배워야 하는 이유 (https://notbee.tistory.com/67) - 통계적 사고와 문제해결 (https://notbee.tistory.com/68) 2. 기술통계 - 모집단과 표본 - 정규성 검정 - 대표값 - 산

notbee.tistory.com

 

글쓴이는 통계 전공자가 아니라는 점 참고 부탁드리며 관련하여 틀린 사항에 대한 지적이나 질문은 언제든지 환영합니다.