JMP 8

기본 통계 3. 추론통계 - 점 추정과 구간 추정

기본 통계 3. 추론통계 - 점 추정과 구간 추정 지난 글에서 통계학을 다음과 같이 분류하였었다. 기술 통계 (Descriptive Statistics) - 측정이나 실험을 통해 얻은 데이터의 정리, 요약, 해석을 통해 자료특성을 계산하는 방법 추론 통계 (Inferential Statistics) - 전체 모집단에서 뽑은 일부 표본을 분석하여 모집단의 특성을 추정하고 검정하는 방법 기술 통계는 표본의 표현이나 시각화에 초점을 맞춘다면, 추론 통계는 표본을 통해 모집단을 추론하는데 관심이 있다. 이때, 모집단의 모수를 추정하는 과정에는 점추정과 구간추정이 있다. 점 추정 - 모수를 하나의 값으로 추정하는 것 - 표본의 통계량을 모수라고 믿는 것 ex) 표본평균, 표본 분산을 모평균, 모분산이라고 가정 구..

JMP/기본 통계 2024.02.24

기본 통계 2. 기술통계 - 히스토그램

기본 통계 2. 기술통계 - 히스토그램 지난 글에서 기술통계를 다음과 같은 순서로 진행한다고 설명하였었다. 이 중 가장 첫 번째로 수행하는 데이터 품질의 시각적 체크 시에 확인할 수 있는 다양한 히스토그램 모양의 예시를 설명하며 기술통계 부분을 마무리하고자 한다. 각 히스토그램의 형태가 발생한 원인을 유추하여 적절한 대응과 해석이 필요하다. 기술통계 순서 1. 데이터 품질을 시각적으로 체크 (그래프를 눈으로 확인하기) 2. 정규성 검정 3. 기술통계 분석 수행 안정형 - 안정적으로 공정 및 측정이 완료된 경우 기울어진형 - 대표값 선정에 주의 필요 쌍봉우리형 - 각기 다른 두 개의 조건으로 공정이 수행되고 있을 가능성이 있다. - 데이터를 Filter로 구분하여 나눠서 분석하는 것이 적합할 수 있다. 절..

JMP/기본 통계 2024.02.24

기본 통계 2. 기술통계 - 대표값

기본 통계 2. 기술통계 - 대표값 지난 시간에는 기술통계를 수행하기 전에 앞서 데이터 품질 체크 및 정규성 검정을 수행하는 법을 정리하였다. 오늘은 기술통계 중 대표값을 얻어내는 작업을 해보고자 한다. 기술통계 순서 1. 데이터 품질을 시각적으로 체크 (그래프를 눈으로 확인하기) 2. 정규성 검정 3. 기술통계 분석 수행 대표값이란 모집단을 가장 잘 대변하는 값이라고 할 수 있다. 다음과 같은 종류가 있다. 평균값 (Mean) - 관측치의 총합을 관측치의 개수로 나눈 값 중앙값 (Median) - 데이터를 크기에 따라 정렬하였을 때 가운데에 위치하는 값 최빈값 (Mode) - 데이터의 빈도수가 가장 큰 값 평균값이 아마 가장 자주 사용하는 값일 것이다. 유의해야 할 점은 평균값은 극단값이 포함되어 있을..

JMP/기본 통계 2024.02.22

기본 통계 2. 기술통계 - 모집단과 표본

기본 통계 2. 기술통계 - 모집단과 표본 통계학은 다음과 같이 관점에 따라서 분류할 수 있다. 기술 통계 (Descriptive Statistics) - 측정이나 실험을 통해 얻은 데이터의 정리, 요약, 해석을 통해 자료특성을 계산하는 방법 추론 통계 (Inferential Statistics) - 전체 모집단에서 뽑은 일부 표본을 분석하여 모집단의 특성을 추정하고 검정하는 방법 기술 통계는 표본의 표현이나 시각화에 초점을 맞춘다면, 추론 통계는 표본을 통해 모집단을 추론하는데 관심이 있다. 여기서 말하는 모집단과 표본의 차이를 살펴보자. 모집단 (Population) - 연구자가 관심을 가지는 집단에 대한 모든 개체의 측정값의 집합 표본 (Sample) - 모집단에서 일부분을 임의로 추출한 측정 값의..

JMP/기본 통계 2024.02.21

기본 통계 1. Intro - 통계적 사고와 문제해결

기본 통계 1. Intro - 통계적 사고와 문제해결 의약품을 제조하고 분석을 수행하는 모든 실험 과정은 프로세스로 볼 수 있다. 프로세스에는 문제를 해결하거나 개선할 수 있는 다양한 정보가 발생한다. 이때, 해당 정보를 관찰하고 데이터를 수집하여 논리적으로 분석하기 위해서 적절한 통계 분석 도구를 선택하고 결론을 내려야 한다. 정보는 항상 산포가 발생한다는 점을 이해해야 한다. 얻어진 데이터는 우주에 존재하는 유일한 값이 아니라, 측정 오차와 제어가 불가능한 변동으로 인하여 발생하는 변동이 있는 것이다. 우리가 실험을 통하여 얻는 결과는 이미 정해져 있는 분포의 집단(모집단)으로부터 소수의 관측 데이터만을 얻게 되며, 정규 분포 값 안에서 어느 포인트에 있는 값을 얻게 되는지는 알 수가 없다. 정리하자..

JMP/기본 통계 2024.02.20

기본 통계 1. Intro - 생명공학 전공자가 통계를 배워야 하는 이유

기본 통계 1. Intro - 생명공학 전공자가 통계를 배워야 하는 이유 생명공학 전공자라면 다양한 실험 후 그룹 간의 차이를 확인하기 위하여 t-test나 One-way ANOVA와 같은 통계 처리를 해본 경험이 있을 것이다. 논문을 읽어봐도 단순히 그래프를 보여주는 것 외에도 통계적으로 유의미한지 여부가 꼭 표기되어 있을 것이다. 대학원이나 연구소에서 이루어지는 기본 통계 외에도, 의약품 제조 회사에서도 마찬가지로 통계를 활용할 일이 많다. 특히, 의약품 제조는 한 번 만들고 그만 두는 것이 아니라 지속적으로 일관된 품질을 유지하는 제품을 생산하는 시스템을 갖추기 위해 Quality by Design (QbD, 설계기반 품질고도화)를 추구한다. QbD - A systematic approach to ..

JMP/기본 통계 2024.02.20

기본 통계 0. 목차

0. 목차 1. Intro - 생명공학 전공자가 통계를 배워야 하는 이유 (https://notbee.tistory.com/67) - 통계적 사고와 문제해결 (https://notbee.tistory.com/68) 2. 기술통계 - 모집단과 표본 (https://notbee.tistory.com/70) - 정규성 검정 (https://notbee.tistory.com/71) - 대표값 (https://notbee.tistory.com/72) - 산포 (https://notbee.tistory.com/73) - 히스토그램 (https://notbee.tistory.com/76) 3. 추론통계 - 점 추정과 구간 추정 (https://notbee.tistory.com/75) - 신뢰 구간 - 예측 구간 - ..

JMP/기본 통계 2024.02.20

변동 계수 (CV, Coefficient of Variation) 개념, 계산, 적용

변동 계수는 상대 표준 편차라고도 불리며, 표준 편차 (Standard Deviation)를 평균 (Average)으로 나눈 것이다. 더보기 변동 계수 = 표준 편차 / 평균 Excel에서 쉽게 구현 할 수 있다. 값 V에 대하여 다음과 같이 셀에 입력하면 변동 계수 %를 구할 수 있다. =Round(Stdev(V1 , V2, ... Vn)/Average(V1, V2, .... Vn)*100,0) Round : 자릿수 반올림 (필수 아니며 콤마 뒤에 값 조절하여 자릿수 조정 가능) Stdev : 표준 편차 Average : 평균 변동 계수는 같은 단위를 가지는 평균값으로 나누어주기 때문에, 서로 다른 단위를 갖는 값끼리 비교할 수 있다. 예시) 표준편차 (SD)와 그래프의 에러바를 보면, 그룹 A가 더 ..

JMP/기본 통계 2023.04.01