중학교 통계중에 지금 생각하니 분산인가 구하는것중에 N 인지 N-1 인지 헷갈리는게 있었는데…그때야 그냥 암기하면 됬는데…내가 이나이에도

623 121.***.103.160

>> Case B 으 경우처럼 클로즈드 시스템인데, 센스님의 3,4 의 경우처럼 모평균이 표본평균과 같아져 버리면,
그냥 (n-1) 를 고려한 언바이어스드 에스티메이터를 생각할 이유가 없어집니다.

그런데 솔직히 이야기 하자면, 자유도만 가지고서는 이 논리의 근거를 설명할 방법은 아직 찾지 못했음. 그러니 자유도만을 가지고 수식을 유도할수 있는지는 나도 모르겠음. 그런데 이 논리의 근거는 사실은 E(X_bar – mu) 를 이용하면 쉽게 설명됨.

다만 한가지 주의 할점은, 현제 센스님은 평균에 대한 자유도와 분산에 대한 자유도가 같은것으로 착각하고 있음.

3,4 번의 일반적인 문제에서는 표본평균을 모른다고 생각하기 때문에 그 인과관계로 인하여 어차피 자유도가 3 이 되는게 맞는다고 생각할수 있음. 그래서 표본평균구할때 그 자유도 3로 나눈것임. 그런데 분산을 구할때는 자유도가 어떨까요? 어떤 경우는 평균과 분산에 같은 자유도를 나누어주고, 또 어떤 경우에는 평균에는 n을 나누어주고 분산에는 n-1 로 나누어주는데, 1,2번은 이미 표본평균값이 구해졌으니 2라는 자유도는 분산에 적용되는거고요. 3,4번은 아직 표본평균이 구해지지 않은 상태니 3이라는 그 자유도는 평균구하는데 나누어지는거에요. 그럼 분산에 나누어지는 자유도는 같을까요? 그런데 내 정의대로 적용 하자면, 5가 뽑혀 {3,4,5} 가 되었으면 표본평균이(여기서는 자유도 3을 이용해서 나누어줌) 4이므로 (모평균은 모르는걸로 가정) 클로즈드 시스템이 되었으므로 자유도를 2로 취급해야 하고, 2로 나누어주어서 분산을 구해 주어야 함. 만약 모평균도 4라는걸 이미 알고 있었다고 한다면, 그 경우는 그냥 3으로 나누어주어 분산을 구해주는것임. (이경우는 여전히 자유도를 2라고 할수도 있지만, 언바이어스드 에스티메이터를 쓰지 않고 그냥 상식적인 표본갯수로 나누는 분산을 이용함.)

4번의 경우를 보면,
이 문제를 자유도로 접근을 이론적으로 제대로 하기 위해서는 모집단의 평균을 어프라이어리로 이용해서 베이지안 씨어렘을 고려하는 다른 어떤 방법이 있을거 같기도 함.