통계 5

기본 통계 2. 기술통계 - 모집단과 표본

기본 통계 2. 기술통계 - 모집단과 표본 통계학은 다음과 같이 관점에 따라서 분류할 수 있다. 기술 통계 (Descriptive Statistics) - 측정이나 실험을 통해 얻은 데이터의 정리, 요약, 해석을 통해 자료특성을 계산하는 방법 추론 통계 (Inferential Statistics) - 전체 모집단에서 뽑은 일부 표본을 분석하여 모집단의 특성을 추정하고 검정하는 방법 기술 통계는 표본의 표현이나 시각화에 초점을 맞춘다면, 추론 통계는 표본을 통해 모집단을 추론하는데 관심이 있다. 여기서 말하는 모집단과 표본의 차이를 살펴보자. 모집단 (Population) - 연구자가 관심을 가지는 집단에 대한 모든 개체의 측정값의 집합 표본 (Sample) - 모집단에서 일부분을 임의로 추출한 측정 값의..

JMP/기본 통계 2024.02.21

기본 통계 1. Intro - 통계적 사고와 문제해결

기본 통계 1. Intro - 통계적 사고와 문제해결 의약품을 제조하고 분석을 수행하는 모든 실험 과정은 프로세스로 볼 수 있다. 프로세스에는 문제를 해결하거나 개선할 수 있는 다양한 정보가 발생한다. 이때, 해당 정보를 관찰하고 데이터를 수집하여 논리적으로 분석하기 위해서 적절한 통계 분석 도구를 선택하고 결론을 내려야 한다. 정보는 항상 산포가 발생한다는 점을 이해해야 한다. 얻어진 데이터는 우주에 존재하는 유일한 값이 아니라, 측정 오차와 제어가 불가능한 변동으로 인하여 발생하는 변동이 있는 것이다. 우리가 실험을 통하여 얻는 결과는 이미 정해져 있는 분포의 집단(모집단)으로부터 소수의 관측 데이터만을 얻게 되며, 정규 분포 값 안에서 어느 포인트에 있는 값을 얻게 되는지는 알 수가 없다. 정리하자..

JMP/기본 통계 2024.02.20

기본 통계 1. Intro - 생명공학 전공자가 통계를 배워야 하는 이유

기본 통계 1. Intro - 생명공학 전공자가 통계를 배워야 하는 이유 생명공학 전공자라면 다양한 실험 후 그룹 간의 차이를 확인하기 위하여 t-test나 One-way ANOVA와 같은 통계 처리를 해본 경험이 있을 것이다. 논문을 읽어봐도 단순히 그래프를 보여주는 것 외에도 통계적으로 유의미한지 여부가 꼭 표기되어 있을 것이다. 대학원이나 연구소에서 이루어지는 기본 통계 외에도, 의약품 제조 회사에서도 마찬가지로 통계를 활용할 일이 많다. 특히, 의약품 제조는 한 번 만들고 그만 두는 것이 아니라 지속적으로 일관된 품질을 유지하는 제품을 생산하는 시스템을 갖추기 위해 Quality by Design (QbD, 설계기반 품질고도화)를 추구한다. QbD - A systematic approach to ..

JMP/기본 통계 2024.02.20

변동 계수 (CV, Coefficient of Variation) 개념, 계산, 적용

변동 계수는 상대 표준 편차라고도 불리며, 표준 편차 (Standard Deviation)를 평균 (Average)으로 나눈 것이다. 더보기 변동 계수 = 표준 편차 / 평균 Excel에서 쉽게 구현 할 수 있다. 값 V에 대하여 다음과 같이 셀에 입력하면 변동 계수 %를 구할 수 있다. =Round(Stdev(V1 , V2, ... Vn)/Average(V1, V2, .... Vn)*100,0) Round : 자릿수 반올림 (필수 아니며 콤마 뒤에 값 조절하여 자릿수 조정 가능) Stdev : 표준 편차 Average : 평균 변동 계수는 같은 단위를 가지는 평균값으로 나누어주기 때문에, 서로 다른 단위를 갖는 값끼리 비교할 수 있다. 예시) 표준편차 (SD)와 그래프의 에러바를 보면, 그룹 A가 더 ..

JMP/기본 통계 2023.04.01

Q test - 사이트 이용하여 쉽게 하기 / 의미 없는 측정값 버리기

실험에 있어서 통계적 유의미함 (statistical significance)는 매우 중요하다. 통계적으로 유의미 하지 않고 단순 경향성만 보이게 되면 신뢰도가 많이 떨어지게 되고 높은 저널에 투고하기 쉽지 않다. 특히, RT-PCR처럼 미세한 실험 스킬에도 큰 영향을 받아 error bar가 전체적으로 크게 나오는 실험들 같은 경우, '아 이 값만 뺄 수 있다면' 같은 생각을 하게 될 것이다. 물론, 마음대로 빼게 된다면 데이터 조작, 데이터 마사징을 하게 되는 것이다. 이 때, 할 수 있는 통계 처리가 있다. 많이 들어봤겠지만 Q test이다. Dixon's Q test는 측정값 내에서 의미가 없을 만큼 크게 값이 벗어나는 Outlier를 제거하기 위한 통계 장치이다. 전체 data set에서 단 한..

연구/실험 2022.05.28