1. Confidence Intervals
2-1. Donfidendce intervals ( t-intervals)
2-2. Hypothesis testing(t-tests)
1. Confidence Interval
우리가 알고 싶은 것은 모집단의 평균
==> 그러나 하나를 꼭 찝어서 추정할 수 없음. 그래서 구간을 추정하는 것임.
1) sample data
모집단의 개수는 모르지만 샘플의 개수만 알 수 있음
2) confidence interval
그래서 신뢰구간을 구해서 표본에서 모집단을 추정값에 대한 신뢰도를 알 수 있음.
모집단 평균을 표본 평균으로 추정함.
이때 , standard error = smapling distribution의 표준편차임.
Confidence interval은 신뢰 수준인데 1- a로 보통 생각함 (99,95,90%)
a = type 1 error (가설 검정에서 다시 나옴)
2-1. Donfidendce intervals ( t-intervals)
t - intervals를 만족시켜려면 sample mean의 값이 정규 분포를 따라야 함.
but 30 이상의 sample size 면 CLT(central limit theorem) 에 의해서 정규분포를 만족함.
t- intervals의 조건
- sample mean 의 정규 분포
- 30 이상의 sample 사이즈
30보다 작더라도 t-intervals 는 너무 정규분포가 아니라면 대부분 잘 맞는 편이다.
t- 분포를 계산 하는 방법 (two-sided t -interval)
&& 여기서 critical point는 t- distribution의 table에서 가져온 값 임 &&
a/2이유는 2side 이기 때문에
자유도가 n-1인 이유는 자유도를 하나 잃었기 때문에 ( sample의 평균에 대한 정보를 하나 잃었기 때문에)