기본 통계 2. 기술통계 - 산포
통계적 사고와 관련된 글에서 언급하였듯이, 모든 데이터는 산포를 갖는다. 지난 시간에는 다양한 대표값 종류를 확인하였고, JMP 프로그램을 활용하여 분석하는 법을 보았다. 해당 글을 따라 수행하면 사실, 그 밑에 원하는 항목을 체크하기만 하면 산포 관련 값을 얻어낼 수 있다.
기본 통계 2. 기술통계 - 대표값
기본 통계 2. 기술통계 - 대표값 지난 시간에는 기술통계를 수행하기 전에 앞서 데이터 품질 체크 및 정규성 검정을 수행하는 법을 정리하였다. 오늘은 기술통계 중 대표값을 얻어내는 작업을 해
notbee.tistory.com
프로그램으로 실습하기 전 분산(Variance), 표준편차 (Standard Deviation), 범위 (Range), 사분위수 (Quartile), 변동계수 (Coefficient of Variance) 등에 관해 간략히 설명하고자 한다. 이 값들은 데이터가 평균으로부터 얼마나 떨어져있는지 확인하기 위한 값들이다.
우선, 평균에서 데이터를 뺀 편차들은 더하면 0이 될 것이다. 따라서 각 편차들을 제곱하여 더한 후 n-1로 나눠준 값이 바로 표본분산이다. 표준편차는 분산에 제곱근을 취하여 얻는다.
범위는 최대값 - 최소값으로써, 극단값이 있을 시 불안정하기 때문에 많이 쓰이는 값은 아니다.
사분위수는 측정값을 순서대로 정렬하여 4등분 하는 수이다.
Q1: 제 1 사분위수 = 25%
Q2: 제 2 사분위수 = 50 % (중앙값)
Q3: 제 3 사분위수 = 75 %
Q1 ~ Q3에 해당하는 25 ~ 75%는 사분위 범위 (IQR, Interquartile Range)라고도 한다.
변동 계수는 상대 표준 편차라고도 불리며, 표준 편차 (Standard Deviation)를 평균 (Average)으로 나눈 것이다. (https://notbee.tistory.com/45)
변동 계수 (CV, Coefficient of Variation) 개념, 계산, 적용
변동 계수는 상대 표준 편차라고도 불리며, 표준 편차 (Standard Deviation)를 평균 (Average)으로 나눈 것이다. 더보기 변동 계수 = 표준 편차 / 평균 Excel에서 쉽게 구현 할 수 있다. 값 V에 대하여 다음과
notbee.tistory.com
위 항목들은 모두 JMP를 통해 간단히 확인 할 수 있다.
1. 지난 정규성 검정 글을 참고하여 정규성 검정을 수행한다.
기본 통계 2. 기술통계 - 정규성 검정
기본 통계 2. 기술통계 - 정규성 검정 정규분포(Normal Distribution)는 종 모양의 좌우대칭 그래프이다. 영어 단어에서 알 수 있듯이 자연스러운, 정상의, 표준의 뜻을 가지고 있으며 데이터가 자연스
notbee.tistory.com
2. p-value가 0.05 이상이므로 해당 데이터 세트는 정규분포를 따른다고 가정할 수 있다.
3. Summary Statistics 핫스팟 - Customize Summary Statistics를 클릭한다.
4. Variance, CV, Range 등 관련 항목을 체크한다.
5. 결과는 다음과 같다.
- 위의 Quartile 항목에서 각 사분위 값을 확인할 수 있으며, 최대값과 최소값 역시 알 수 있다.
- 아래 Summary Statistics에서 표준편차, 분산, CV, Range를 확인 할 수 있다.
Distribution의 최상단에 그래프와 더불어 Box Plot을 확인할 수 있다. 이 Box Plot을 통해서도 데이터의 산포를 어느정도 가늠할 수 있다. 하지만 표본 개수가 적을 시에는 그냥 그래프를 확인하는 것이 좋다.
기본 통계 0. 목차
0. 목차 1. Intro - 생명공학 전공자가 통계를 배워야 하는 이유 (https://notbee.tistory.com/67) - 통계적 사고와 문제해결 (https://notbee.tistory.com/68) 2. 기술통계 - 모집단과 표본 - 정규성 검정 - 대표값 - 산
notbee.tistory.com
글쓴이는 통계 전공자가 아니라는 점 참고 부탁드리며 관련하여 틀린 사항에 대한 지적이나 질문은 언제든지 환영합니다.