본문 바로가기

Statistics/Basic Knowledge

(5)
Likelihood Ratio (LR) 통계학자이자 유전학자인 Ronald Aylmer Fisher (UK, 1890-1962)에의해 제안된 실험가설의 평가 척도로써 어떠한 Data가 주어졌을 때, 가설(H)가 참이라는 가정하에서, Data가 발생할 정도를 나타낸다. LR_H = (data/H) / (data/Ho), (data/H: data가 H 상황에서 출현한 확률)
Odds Ratio (OR) 관측된 데이터와 세워놓은 가설(H)사이의 연관된 정도를 정량적으로 나타내는 통계학적 계산방법으로 정의되며, 관측 Data가 세워놓은 가설(H)에서 발생할 확률과 Data가 귀무가설(Ho)에서 발생할 확률의 비율로 계산됨. Odds Ratio가 1 일 경우에는, '관측 데이터와 가설(H)이 독립적임'과 필요충분조건의 관계를 가짐.
Statistics vs Statistic Statistics (통계학): 무작위적인(Random) 상황 속에서 얻어지는 데이터를 수집 및 요약하여 분석에 이르는 자연과학 학문의 한 분야. Statistic (통계량): 수집된 데이터집단 속 일부분에 해당하는 데이터 객체.
모집단과 표본집단이란? 우리는 통계학(Statistics)를 배우게 되면, 데이터를 수집하게되고, 수집된 데이터로부터 의미를 추론하는 과정을 거치게된다. 하지만, 현실적인 제약요건들(Labor Cost: Time & Money)에 의해서 수집되는 데이터는 현실세계에 나타나는 모든 상황(모집단)을 반영하기가 힘들고, 원하든 원하지않든 선택적인 상황들을 반영하는 데이터(표본집단)를 통해 모집단의 상황을 추정하게된다. 즉, 표본집단은 모집단의 데이터 분포를 추정하기 위해 sampling된 모집단의 부분집단이다.
P-value란 무엇인가? 정성적 분석의 상황에서는 연구자가 세워 놓은 가설(H)이 성립될 확률이 존재하고, 이와는 반대되는 귀무가설(Ho)이 성립될 확률이 존재할 수 있다. 이 때, 귀무가설(null-hypothesis)이 성립될 확률을 p-value라고 정의한다.