중학교 통계중에 지금 생각하니 분산인가 구하는것중에 N 인지 N-1 인지 헷갈리는게 있었는데…그때야 그냥 암기하면 됬는데…내가 이나이에도

sense 96.***.233.115

> 그럼 다시 자유도 해석접근법으로 돌아가서…..자유도로 접근하는 방법은 이 문제에 또 다른 근본적인 해석 접근 방법을 진짜로 제시해주는걸까? 아니면 겉으로 보기에만 관련있는것처럼 보이는걸까?

님 생각하고 제 생각하고 이제 같습니다. 그리고 저도 어느 정도 후자처럼 추측합니다. 자유도라는 용어와 개념은 꽤 괜찮은 비유 아니냐 하는 거죠.

그 통계량의 자유도가 본질적으로도 직관적으로도 n-1이어서 거기에 n-1이라는 팩터가 나오는 게 아니고, 수학적으로 n-1이 유도된 후 그것을 비수학자에게 설명하기 위한 비유로 거기에 자유도라는 물리학 용어를 가져다 쓰는데 우연히 그게 참 잘 맞았었던 게 아니냐 하는 정도.

이게 표본분산 딱 하나에서만 n-1 얘기가 나오면 여기에 굳이 자유도라는 말을 가져다 붙일 이유가 그다지 없다고 봅니다. 그런데 Fisher의 또다른 연구인 분산분석에 n-k의 팩터가 또 나온다고 합니다 (분산분석 몰라요). Fisher는 물론 자기가 만든 방법이니까 수학적 증명을 했겠지만, 수식에 나오는 n-k 이라는 팩터의 본질에 대해 좀 더 잘 이해시키는 방법이 필요했겠죠.

그리고 나서 표본분산을 되돌아보니 거기에 나타나는 n-1과 분산분석에 나타나는 n-k의 공통점에 대해 고찰을 하고 난 후, 이건 물리학에서 사용되는 자유도 개념에 비유하면 거의 비슷하다는 것을 발견하고 그 n-1, n-k 라는 팩터에 자유도라는 이름을 붙인 게 아니냐 하는 생각이 듭니다.

통계학에서 자유도라는 말을 교과서에 남긴 첫 사례가 Fisher라고 합니다. 이리저리 찾아보니 그래요.

Fisher가 쓴 통계책인 Statistical Methods for Research Workers라는 책이 4판까지 나오느데 이게 거의 현대 통계 교과서와 비슷합니다. 그런데 Fisher가 밝힌 이 책의 주요 audience가 생물학자들입니다. 생물학자들 대상의 책이므로 수학적 증명으로 이해시키는 것보다는 비유를 들어 “이해한 것과 같은 착각”을 들게 하는 방법을 동원하는 것은 유효하다고 생각합니다.

그래서 제 의견을 요약하면 님 의견과 같은데요.

비유는 비유일 뿐이다.

“자유도가 n-1이므로 그 수식에 n-1을 사용한다”라고 설명하는 건 사실 이해하지 못 했지만 이해한 것과 같은 착각을 일으켜 수식에 대한 거부감을 줄여 수용 정도를 높이는 용도인 것이고 (‘그렇군’ 하고 일단 넘어가는 사람들이 많을 테니),

“수학적으로 샘플의 분산이 모분산보다 (n-1)/n 만큼 평균적으로 작기 때문에 그 역수 n/(n-1)을 곱하여 보정하는 과정에서 n-1이 수식에 나타난다”라고 이해하면 본질을 이해한 것이다 라고 생각합니다.