1. 자료
질적 자료(범주형) -> 1) 명목 척도: 측정대상이 어느 집단에 속하는지 분류 2) 순서 척도 : 측정대상이 특성의 서열관계를 관측하는 척도로 선택사항이 일정한 순서로 되어있음
양적 자료(수치형) -> 1) 구간 척도: 절대적 원점이 존재하지 않음 ex) 온도, 지수 2) 비율 척도 : 절대적인 원점이 있음. 두 측정값의 비율이 의미가 있음 ex) 나이, 키, 몸무게
2. 확률변수의 개념 : 확률변수란 정의역이 표본공간이고 치역이 실수값인 함수
3. 이산형 확률분포 : 베르누이, 이항분포, 기하분포, 음이항분포, 포아송분포, 초기하분포, 다항분포
1) 베르누이 확률분포 : 실험의 결과가 성공과 실패의 두 가지 상호 배반적 사건으로 나누어지는 분포로, 베르누이 시행을 1회 시행하여 일어난 두 가지 결과값이 0과 1로 결정되는 확률변수 X에 대해서 P(X=0)=p, P(X=1)=q이면 q=1-p를 만족함.
2) 이항분포 : 베르누이 시행을 N번 반복했을 때 k번 성공할 확률, x~B(n,p), E(X)=np, var(X) = np(1-p), n이 충분히 크면 이항분포는 정규분포에 근사할 수 있음.
3) 기하분포 : 성공확률이 p인 베르누이 시행에서 처음 성공이 일어날 때까지 반복한 시행횟수를 X라고 할 때, X는 성공확률이 p인 기하분포를 따른다고 하고 X~Geo(p)로 나타냄. E(X)=1/p, Var(X)= 1-p/ p^
3) 음이항분포 : 음이항분포는 기하분포를 확장한 것으로, 성공확률이 p인 베르누이 시행에서 r번 성공할 때까지 반복한 시행횟수 혹은 실패횟수에 대한 확률.
4) 포아송분포 : 시간과 공간 내에서 발생하는 사건의 발생횟수에 대한 확률분포. X~pois(lamda)로 나타내며, lamda= E(X) = Var(X).
5) 초기하분포 : N개의 유한모집단에서 표본을 비복원추출할때, k번 성공할 확률 시행이 종속적이므로 앞의 시행이 다음 일어날 시행의 확률에 영향을 줌.
6) 다항분포 : 이항분포를 확장한 것으로 세가지 이상의 결과를 가지는 반복 시행에서 발생하는 확률분포
4. 연속형 확률분포 : 균일분포, 정규분포, 지수분포, 감마분포, t-분포, F-분포, X^-분포
1) 균일 분포 : 확률변수가 정의되는 구간에서 확률밀도함수의 값이 모두 동일한 확률분포로 정의되는 분포, E(X) = a+b/2, Var(X)=(b-a)^/12
2) 정규분포: 평균이 m이고 표준편차가 σ인 x의 확률밀도함수로 좌우대칭의 종 모양으로 생긴 분포이며, 가우스 분포로도 불림. 정규분포의 모양과 위치는 분포의 평균과 표준편차로 결정됌. 따라서 모수는 평균과 표준편차 2개임.
3) 감마분포 : 지수분포를 일반화한 분포로 두 개 이상의 지수분포가 합쳐져 어떤 사건이 k번 발생할 때까지의 경과시간에 대한 분포이다.
4) t-분포 : 표준정규분포와 같이 평균이 0을 중심으로 좌우가 동일한 분포를 따름. 확률을 구할 때 사용하지 않고 신뢰구간과 가설검정에서 사용되는 분포. 모표준편차를 모르며 표본의 크기가 30보다 작고 집단 간 평균이 동일한지 알고자할 때 t-분포를 사용.
5) 카이스퀘어 분포: 모평균과 모분산이 알려지지 않은 모집단의 모분산에 대한 가설 검정에서 사용되는 분포. 두 집단 간의 동질성 검정에 활용됌. 자유도에 따라 분포의 형태가 달라지고, 자유도가 커지면 분포의 모양이 대칭에 가까워짐.
6) F-분포 : 두 집단간 분산의 동일성 검정에 사용되는 검정 통계량의 분포. 비대칭 분포의 형태를 보이며, 두 개의 자유도 n1(집단수 -1), n2(표본수-1)에 의해 분포의 형태가 결정됌. 자유도가 커질수록 정규분포에 가까워짐
'통계' 카테고리의 다른 글
[통계] 표본추출 방법 (1) | 2023.09.21 |
---|---|
[통계] 추론통계 (0) | 2023.09.21 |
[통계] 비모수 통계 (0) | 2023.07.16 |
[통계] 1종 오류와 p-value (0) | 2023.06.09 |
[통계] 비율차이에 대한 가설검정 (0) | 2023.06.06 |