jmp 7

기본 통계 2. 기술통계 - 히스토그램

기본 통계 2. 기술통계 - 히스토그램 지난 글에서 기술통계를 다음과 같은 순서로 진행한다고 설명하였었다. 이 중 가장 첫 번째로 수행하는 데이터 품질의 시각적 체크 시에 확인할 수 있는 다양한 히스토그램 모양의 예시를 설명하며 기술통계 부분을 마무리하고자 한다. 각 히스토그램의 형태가 발생한 원인을 유추하여 적절한 대응과 해석이 필요하다. 기술통계 순서 1. 데이터 품질을 시각적으로 체크 (그래프를 눈으로 확인하기) 2. 정규성 검정 3. 기술통계 분석 수행 안정형 - 안정적으로 공정 및 측정이 완료된 경우 기울어진형 - 대표값 선정에 주의 필요 쌍봉우리형 - 각기 다른 두 개의 조건으로 공정이 수행되고 있을 가능성이 있다. - 데이터를 Filter로 구분하여 나눠서 분석하는 것이 적합할 수 있다. 절..

JMP/기본 통계 2024.02.24

기본 통계 2. 기술통계 - 산포

기본 통계 2. 기술통계 - 산포 통계적 사고와 관련된 글에서 언급하였듯이, 모든 데이터는 산포를 갖는다. 지난 시간에는 다양한 대표값 종류를 확인하였고, JMP 프로그램을 활용하여 분석하는 법을 보았다. 해당 글을 따라 수행하면 사실, 그 밑에 원하는 항목을 체크하기만 하면 산포 관련 값을 얻어낼 수 있다. https://notbee.tistory.com/72 기본 통계 2. 기술통계 - 대표값 기본 통계 2. 기술통계 - 대표값 지난 시간에는 기술통계를 수행하기 전에 앞서 데이터 품질 체크 및 정규성 검정을 수행하는 법을 정리하였다. 오늘은 기술통계 중 대표값을 얻어내는 작업을 해 notbee.tistory.com 프로그램으로 실습하기 전 분산(Variance), 표준편차 (Standard Devia..

카테고리 없음 2024.02.22

기본 통계 2. 기술통계 - 대표값

기본 통계 2. 기술통계 - 대표값 지난 시간에는 기술통계를 수행하기 전에 앞서 데이터 품질 체크 및 정규성 검정을 수행하는 법을 정리하였다. 오늘은 기술통계 중 대표값을 얻어내는 작업을 해보고자 한다. 기술통계 순서 1. 데이터 품질을 시각적으로 체크 (그래프를 눈으로 확인하기) 2. 정규성 검정 3. 기술통계 분석 수행 대표값이란 모집단을 가장 잘 대변하는 값이라고 할 수 있다. 다음과 같은 종류가 있다. 평균값 (Mean) - 관측치의 총합을 관측치의 개수로 나눈 값 중앙값 (Median) - 데이터를 크기에 따라 정렬하였을 때 가운데에 위치하는 값 최빈값 (Mode) - 데이터의 빈도수가 가장 큰 값 평균값이 아마 가장 자주 사용하는 값일 것이다. 유의해야 할 점은 평균값은 극단값이 포함되어 있을..

JMP/기본 통계 2024.02.22

기본 통계 2. 기술통계 - 정규성 검정

기본 통계 2. 기술통계 - 정규성 검정 정규분포(Normal Distribution)는 종 모양의 좌우대칭 그래프이다. 영어 단어에서 알 수 있듯이 자연스러운, 정상의, 표준의 뜻을 가지고 있으며 데이터가 자연스러운 산포에 의하여 갖게 되는 분포 형태이다. 기술통계는 데이터가 정규분포를 따르는지 여부에 따라서 분석이 달라지기 때문에 다음과 같은 과정을 거친 후 수행한다. 기술통계 순서 1. 데이터 품질을 시각적으로 체크 (그래프를 눈으로 확인하기) 2. 정규성 검정 3. 기술통계 분석 수행 오늘은 이 중 정규성 검정을 JMP 프로그램으로 수행하는 방법을 정리하였다. 1. 아래 예제파일을 다운로드한다. 2. 예제파일의 데이터를 다음과 같이 A 혹은 B 방법 중 하나로 Import 한다. A. A-1. F..

카테고리 없음 2024.02.22

기본 통계 1. Intro - 통계적 사고와 문제해결

기본 통계 1. Intro - 통계적 사고와 문제해결 의약품을 제조하고 분석을 수행하는 모든 실험 과정은 프로세스로 볼 수 있다. 프로세스에는 문제를 해결하거나 개선할 수 있는 다양한 정보가 발생한다. 이때, 해당 정보를 관찰하고 데이터를 수집하여 논리적으로 분석하기 위해서 적절한 통계 분석 도구를 선택하고 결론을 내려야 한다. 정보는 항상 산포가 발생한다는 점을 이해해야 한다. 얻어진 데이터는 우주에 존재하는 유일한 값이 아니라, 측정 오차와 제어가 불가능한 변동으로 인하여 발생하는 변동이 있는 것이다. 우리가 실험을 통하여 얻는 결과는 이미 정해져 있는 분포의 집단(모집단)으로부터 소수의 관측 데이터만을 얻게 되며, 정규 분포 값 안에서 어느 포인트에 있는 값을 얻게 되는지는 알 수가 없다. 정리하자..

JMP/기본 통계 2024.02.20

기본 통계 1. Intro - 생명공학 전공자가 통계를 배워야 하는 이유

기본 통계 1. Intro - 생명공학 전공자가 통계를 배워야 하는 이유 생명공학 전공자라면 다양한 실험 후 그룹 간의 차이를 확인하기 위하여 t-test나 One-way ANOVA와 같은 통계 처리를 해본 경험이 있을 것이다. 논문을 읽어봐도 단순히 그래프를 보여주는 것 외에도 통계적으로 유의미한지 여부가 꼭 표기되어 있을 것이다. 대학원이나 연구소에서 이루어지는 기본 통계 외에도, 의약품 제조 회사에서도 마찬가지로 통계를 활용할 일이 많다. 특히, 의약품 제조는 한 번 만들고 그만 두는 것이 아니라 지속적으로 일관된 품질을 유지하는 제품을 생산하는 시스템을 갖추기 위해 Quality by Design (QbD, 설계기반 품질고도화)를 추구한다. QbD - A systematic approach to ..

JMP/기본 통계 2024.02.20

기본 통계 0. 목차

0. 목차 1. Intro - 생명공학 전공자가 통계를 배워야 하는 이유 (https://notbee.tistory.com/67) - 통계적 사고와 문제해결 (https://notbee.tistory.com/68) 2. 기술통계 - 모집단과 표본 (https://notbee.tistory.com/70) - 정규성 검정 (https://notbee.tistory.com/71) - 대표값 (https://notbee.tistory.com/72) - 산포 (https://notbee.tistory.com/73) - 히스토그램 (https://notbee.tistory.com/76) 3. 추론통계 - 점 추정과 구간 추정 (https://notbee.tistory.com/75) - 신뢰 구간 - 예측 구간 - ..

JMP/기본 통계 2024.02.20