ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 귀무가설 대립가설 유의수준
    통계 2021. 1. 16. 21:14

    상식적인 추론과정을 버리고 새로운 추론 과정을 따라보자.

    예를 들어, 상자 X에는 검은색 공 9개와 흰색 공 1개가 있고, 상자 Y에는 검은색 공 2개와 흰색 공 8개가 있다. 

    공을 한 개 꺼냈더니 흰색 공이었다. 그렇다면 두 개의 상자 중 어디에서 뽑았을까. 

     

    사실 1. X 또는 Y

    사실 2. X라면 대체로 검은 색 공 -> 10% 확률로 틀릴수는 있다.

    사실 3. Y라면 대체로 흰 색 공 -> 20% 확률로 틀릴수는 있다. 

    사실 4. 검은색 공

     

    이제 새로운 과정을 따라가 보자. 먼저 위의 문제는 본능적으로 당연히 X라고 하겠지만 한번 Y라고 가정해보자. (이런 간단한 문제가 아닌 확률을 예측 할 수 없는 문제를 생각.)

    과정 1. Y라고 가정 -> 귀무가설

    과정 2. 사실 3에서 흰색공이라는 결론 도출

    과정 3. 사실 4와 모순된 결과이므로 귀무가설 기각.

     

    통계학의 가설 검정의 간단한 예제이다. 구체적으로 설명하면, 

    과정 1. 검정하려는 가설 A를 세운다

        - 이 가설을 귀무가설 또는 영 가설이라고 한다. (위의 예제에서는 "상자 Y다") 

        - 원래 입증하려는 내용과 반대되는 가설. 즉, 모집단에서 독립변수와 종속변수(결과 변수) 사이에 아무런 관련이 없거나 의미가 없다는 가설. 즉, 우리는 이것을 기각할 목표로 해야된다. 

    과정 2. 가설 A가 옳지 않을 경우에 결론지을 가설 B를 준비한다. 

        - 이 가설을 대립가설(연구 가설, 유지 가설) 이라고 한다 (위의 예제에서는 "상자 X다")

        - 원래 입증하려는 내용의 가설. 즉, 모집단에서 독렵변수와 종속 변수 사이에 어떤 특정한 연관이 있다는 가설.

    과정 3. 가설 A가 옳다는 가정하에 적은 확률 $ \alpha $로 밖에 관측되지 않는 현상 $ x $를 생각한다. (위의 예제에서는 검은공이 나왔다는 사실과는 별개로 상자 Y가 나왔다고 가정 했으므로 그에 대해서만 생각한다. 즉 Y에서는 검은 공이 적으므로 검은 공이 나오는 현상을 생각함.)

    과정 4. 현상 x가 관측되었으면 (x: 검은 공이 나오는 것을 생각, 사실 4 대로 검은공이 관측됨. ) 귀무가설을 기각한다. 왜냐하면 과정 3에서 귀무가설을 기각할 현상을 세우고(적은 확률) 실제로 그 현상이 발생했으므로. 

    과정 4-2. 현상 x가 관측되지 않았으면 귀무가설이 맞고 입증됨. 

     

    이 때 가설 A를 기각할 것인가의 기준이 되는 확률 $ \alpha $ 를 유의수준이라 한다. 

        - 적은 확률 $ \alpha $의 확률로 일어나는 현상이 관측되면 가설을 포기하게 되므로, "가설 A가 올바를 때 포기할 확률". 즉 이 포기할 확률이 높아지면 x를 잘 포기한다. 즉 우리의 본능적인 추론이 맞을 확률이 높아진다. 하지만 A를 기각하지 않음으로서 취할 수 있는 이득을 잃어버린다. 만약 $ \alpha $를 100퍼로 잡으면 가설 A가 맞든 맞지않는 무조건 기각한다. 즉, 위의 예제에서는 기각하는 것이 맞지만 암 예제와 같은 경우는 단순 산술적으로 계산 할 수가 없다. 

     

    예제)

    상자 X에는 검은 공 96개와 흰 공 4개가 들어있다. 상자 Y에는 검은 공 4개와 흰 공 96개가 들어있다. 공은 한 개 뽑았는데 흰 공이었다. 유의수준 5%, 1%로 잡을 때 여기서 할 수 있는 이야기

    1. 먼저 흰공이 나왔으므로 본능적으로 상자 Y라는 것을 안다. 따라서 귀무가설 (기각하고 싶은 가설) 을 "상자 X다", 대립가설을 "상자 Y다"로 잡는다.

    2. 유의 수준 5%이면 귀무가설에서 적은 확률인 흰공이 나올 확률은 4%이다. 이는 귀무가설이 올바를 때 기각할 확률 보다 작으므로 귀무가설을 기각한다.

    3. 유의 수준 1%이면 현상 (흰공을 뽑았음)의 확률이 귀무가설이 올바를 때 기각할 확률보다 높으므로 기각하지 않는다. 

    4. 공을 다시 넣고 다시 뽑았는데 또 흰공이 나왔다. 이러면 두번 연속 흰공을 뽑을 확률을 현상이라고 생각해야된다. 즉, 귀무가설이라 가정하고 (상자 X라 가정하고) 적은 확률 (2번 연속 흰 공이 나올 확률)은 1%보다 작으므로 귀무가설을 기각한다. 

    '통계' 카테고리의 다른 글

    object detection에서의 precision & recall & AP & mAP  (0) 2021.01.28

    댓글

Designed by Tistory.