hot topic


최근 영화감독 '크리스토퍼 놀란'의 인터스텔라는 놀라운 상상력과 놀라운 영상, 그리고 과학적으로도 충분히 고민해볼 만한 논란거리를 던져주며 흥행몰이 중입니다. 저도 놀라면서 봤지만 놀란은 정말 언제나 놀랍네요. 말장난은 이정도까지만 하고 오늘의 주제를 소개하겠습니다. 오늘은 인터스텔라에 나왔던 '일어날 일은 일어난다'는 머피의 법칙의 통계적인 의미를 생각해보고, 이와 관련된 통계학자 R.A 피셔의 밀크티 논란 일화를 소개해보겠습니다.

 

 

확률(Probability)과 가능성(Likelihood)
일어날 법한 일이 일어난다

 

 

통계학에서 바라본 머피의 법칙


 

영화 속에서 친구들에게 이름 때문에 놀림을 받은 딸 머피는 왜 자신의 이름을 '일은 항상 안 좋은 쪽으로 발생한다'는 의미의 머피의 법칙에서 따왔냐며 아버지 쿠퍼에게 항의합니다. 그러자 쿠퍼는 머피를 달래며 '머피의 법칙의 본래 뜻은 '안 좋은 일이 일어난다'는 것이 아니라 '일어날 일은 일어난다'는 뜻이라고 말해줍니다.

 

머피와 쿠퍼 (출처-인터스텔라)

 

그리고 이런 사회통념과는 조금 다른 머피의 법칙에 대한 쿠퍼의 해석인 '일어날 일은 일어난다'는 영화 전체에 있어 중요한 복선과도 같은 역할을 합니다. 영화 후반부 쿠퍼는 5차원의 블랙홀 속에 갇힙니다. 그러나 그 속에서 쿠퍼가 시공간을 넘나드는 '묵찌빠 신공'으로 머피에게 중력방정식의 특이변수를 알려줘 나중에 쿠퍼와 머피가 재회하는 기적과도 같은 일이 일어납니다. 그러나 이 기적같은 일도 사실은 결국 쿠퍼가 말하는 '머피의 법칙' 즉, '일어날 일'이었기에 일어났다는 것입니다.

하지만, '일어날 일은 일어난다'는 머피의 법칙은 통계학의 관점에서 생각해보면 '일어날 법한 일이 일어난다.'라는 말로 바꿔 써야 할 것입니다. 즉, 통계학에서는 '일어날 법한 일(일어날 확률이 있는, 혹은 높은 일)이 더 많이, 빈번히 일어난다'고 보는 것입니다. 따라서, 안 좋은 일이 일어나 일이 꼬인다'는 의미의 머피의 법칙도 통계학적인 관점에서 봤을 때는 단지 안 좋은 일이 일어날 '확률이 높았기' 때문에 안 좋은 일이 일어났다는 것입니다. 그런데 이와 같은 '일어날 확률이 높은 일이 더 많이 일어날 것이다'라는 생각은 사실 너무 단순하면서도 당연한 소리 같아 보입니다. 하지만 이 단순 명료한 직관은 통계학에서 아주 중요한 역할을 하는데요, 특히나 통계적인 추정 분야에서 아주 중요한 통찰을 줍니다. 그렇다면 그 이유는 무엇일까요?

 

상자 안에 허니버터칩이 더 많이 들어있을 가능성은?


 

다음의 예시를 통해 '일어날 법한 일이 일어난다'는 단순한 직관이 통계적인 추론에서 어떠한 크나큰 통찰을 가져다주는지 알아보겠습니다.

여기에 요즘 구하기 힘들다는 허니버터칩 12봉지와 건빵 3봉지가 들어 있는 과자상자가 있습니다. 밑의 그림처럼 과자 상자 안에 허니버터칩이 더 많이 들어있기 때문에 만약 눈을 가린 채 과자를 꺼낸다면 그 과자가 허니버터칩일 확률이 더 높을 것입니다. 그렇다면 우리는 허니버터칩을 꺼낼 확률이 높기 때문에 '허니버터칩을 꺼내는 일'이 일어나는 경우가 많을 것이라고 기대할 수 있습니다.

 

통계청블로그 임현공 기자

 

 

이번에는 반대로 밑에 그림처럼 상자 안에 허니버터칩과 건빵이 들어있다는 것은 알지만 각각 몇 봉지 씩 들어 있는지 알 수 없는 경우를 생각해 봅시다. 그리고 이번에도 마찬가지로 눈을 가리고 상자 안에서 과자를 꺼냅니다. 그런데 과자 4봉지를 꺼내고 보니, 그중 허니버터칩이 3봉지이고 건빵이 1봉지였습니다. 이때 우리는 꺼낸 4봉지 중 허니버터칩이 더 많은 이유가 과자상자 안에 허니버터칩이 더 많기 때문이라고 생각할 수 있습니다. 왜냐하면 만약 상자 안에 건빵이 더 많았더라면 4봉지를 꺼냈을 때 허니버터칩보다는 건빵이 더 많이 뽑힐 것으로 예상되기 때문입니다. 따라서, 우리는 우리가 꺼낸 4봉지 중 허니버터칩이 건빵보다 더 많았기 때문에 상자 안에 허니버터칩이 더 많을 가능성이 높다고 생각할 수 있을 것입니다.

 

통계청블로그 임현공 기자

 

즉, 우리는 '일어날법한 일이 더 많이 일어날 것이다'라는 직관 덕분에 관찰된 결과로부터 가장 가능성이 높은 모습(모수)을 통계적으로 추론할 수 있는 것입니다. 그렇다면 다음으로 이런 직관이 구체적으로 통계적인 추론에서 어떻게 활용될 수 있는지를 추론통계학의 대가이자 수리통계학의 발전에 엄청난 기여를 한 R.A 피셔의 재미난 일화를 통해 소개해보도록 하겠습니다. 

 

 

R.A 피셔의 실험계획과 가설검정
영국의 여인이 절대미각을 가졌을 가능성은?

 

지금까지 맛있는 허니버터칩으로 꽤나 머리 아픈 얘기를 해왔는데요, 그렇다면 이번에는 화제를 바꿔서 머리를 식힐 겸 다른 질문으로 시작해보겠습니다. 여러분들은 탕수육을 드실 때 소스를 부어드시나요? 아니면 찍어드시나요?  '부먹vs찍먹'은 정말 '엄마vs아빠'만큼이나 많은 사람들 사이에서 선호가 갈리는 영원히 풀리지 않을 것 같은 수 많은 논란 중 하나인데요, 이와 비슷한 논란이 영국에도 있다고 합니다.

 

 

밀크티 논란 '우유 먼저 넣기 vs 홍차 먼저 넣기'


 

밀크티를 즐기는 영국에서는 밀크티에 우유 먼저 넣는 것이 더 맛있는지, 홍차를 먼저 넣는 것이 더 맛있는지 논란이 있다고 합니다. 그런데 사실 탕수육은 소스를 부어먹느냐 찍어먹느냐에 따라 튀김 옷의 눅눅한 정도의 차이로 인해 맛이 다를 수도 있지만, 밀크티의 경우는 우유를 먼저 넣느냐 홍차를 먼저 넣느냐에 따라 맛에 큰 차이가 날 것 같지는 않아 보입니다. 그리고 이런 밀크티 논란에 대한 과학계의 입장도 우유는 차갑고 홍차는 따뜻하기 때문에 우유와 홍차를 넣는 순서에 따라 밀크티의 분자 구조에 미묘한 차이가 발생할 수 있어도 이를 사람의 미각으로 구별할 수는 없다는 것이라고 합니다.

 

대장금이 출동하면 어떻게될까? (출처-MBC 대장금)

그런데 만약 대장금처럼 미각이 뛰어난 사람이 있다면 어떻게 되었을까요? 밀크티의 분자구조적인 차이까지 느낄 수 있는 절대미각으로 밀크티의 미묘한 맛의 차이를 구별할 수 있지 않았을까요? 그런데 실제로 과거에 영국에서 자신이 대장금과 같은 절대미각을 가졌다고 주장하는 여인이 있었다고 합니다.

 

The Lady tasting tea(차를 시음하는 여인)


 

1920년대에 영국에 있는 케임브리지 대학에서 연구원들과 그들의 부인들이 한 곳에 모여 밀크티를 마시는 자리가 있었다고 합니다. 그런데 그 자리에 있던 한 여인이 자신은 밀크티에 우유가 먼저 들어갔는지 홍차가 먼저 들어갔는지 구별할 수 있다고 주장하기 시작했습니다. 하지만 과학적인 사고를 신봉하는 연구원들이 모인 자리였기에 다들 그 여인의 주장이 말도 안 된다고 생각하며 여인의 주장을 무시하는 분위기였는데요, 그런 사람들 중 혼자만 다른 반응을 보이는 신사가 있었습니다. 그 신사가 바로 R.A 피셔였는데요, 피셔는 아무런 근거 없이 여인의 주장을 거짓이라고 판단하기보다는 실험을 통해 여인의 주장을 검정해보자고 제안을 합니다. 그리고 그가 고안해낸 검정절차를 간략하게 정리하면 다음과 같습니다.

 

1. 가설을 세운다.

가설1: 여인의 주장은 거짓이다 = 여인이 밀크티에 우유와 홍차가 들어간 순서를 맞출 확률은 1/2이다.

가설2: 여인의 주장은 참이다 = 여인이 밀크티에 우유와 홍차가 들어간 순서를 맞출 확률은 1/2보다 크다.

 

2. 실험을 한다.

피셔는 여인이 볼 수 없는 곳에서 만든 총 8잔의 밀크티(우유를 먼저 넣은 밀크티 4잔과 홍차를 먼저 넣은 밀크티 4잔)을 준비해서 랜덤한 순서로 여인에게 가져다줍니다. 그리고 건네받은 밀크티를 맛본 여인은 밀크티에 우유와 홍차 중 무엇이 먼저 들어갔는지 자신의 생각을 말합니다. 그리고 여인이 맞춘 횟수를 기록한다.

 

3. 맞춘 횟수를 바탕으로 '가설1'과 '가설2' 중에 하나를 결정한다.

8번 중 거의 모두 맞춘다면 여인의 주장은 참으로 받아들이고, 그렇지 않다면 여인의 주장은 거짓으로 받아들인다.

 

위와 같이 가설을 세우고, 실험이나 관측을 통해 나온 결과를 바탕으로 가설의 기각 여부를 결정하는 과정을 가설검정이라고 합니다. 그런데 이 가설검정의 구조를 잘 살펴보면 이 가설 검정에도 앞에서 얘기하던 '일어날 법한 일이 일어난다'는 직관이 활용되고 있음을 알 수 있습니다.

 

여인이 밀크티를 구별할 확률이 높다면 맞힌 횟수가 많을 것이다.

반대로, 맞힌 횟수가 많다면 맞힐 확률이 높을 가능성이 클 것이다.

 

즉, 피셔는 8번의 밀크티 시음에서 여인이 맞추는 정답 횟수를 바탕으로 여인이 밀크티를 구별해내는 확률이 어느 정도인지를 추론하고자 했던 것입니다. 이는 과자 4봉지를 뽑았을 때 나오는 허니버터칩의 봉지 수를 통해 과자 상자 안의 허니버터칩의 개수를 추론하는 것과 같은 맥락입니다.

 

 

일반인들은 절대미각을 가지고 있지 않기 때문에 밀크티를 구별해낼 확률은 결국 '찍어서 맞추는' 확률인 1/2이 될 것입니다. 따라서 일반인이 8번의 도전을 하면 그중 절반인 4번 정도를 맞출 것입니다. 반대로 절대미각이 있어 실제로 밀크티의 맛이 차이를 느낄 수 있다면, 밀크티를 구별해낼 확률은 1/2보다 훨씬 큰 1에 가까운 확률이 될 것입니다. 따라서 절대미각을 가진 사람이 8번의 도전을 하면 거의 8번 모두를 맞출 것입니다.

 

통계청블로그 임현공 기자

따라서, 여인이 8번의 시음 중 정답을 맞힌 횟수가 4에 가까운 3,4,5번 정도밖에 되지 않는다면, 여인이 밀크티를 구별해낼 확률은 1/2 정도 밖에 되지 않을 가능성이 높고 밀크티를 구별할 수 있다는 여인의 주장은 거짓이라고 결론 내릴 수 있을 것입니다. 반면에, 여인이 8번의 시음 중 정답을 맞힌 횟수가 8에 가까운 7, 8번이나 된다면, 여인이 밀크티를 구별해낼 확률은 1/2보다 훨씬 클 가능성이 높고, 밀크티를 구별할 수 있다는 여인의 주장은 참이라고 결론 내릴 수 있을 것입니다.

 

그리고 전해오는 이야기에 의하면 그렇게 여인의 8번의 밀크티 시음이 끝난 후, 결과를 본 피셔는 아주 놀라고 맙니다. 왜냐하면 놀란의 영화보다도 더 놀랍게도 그 여인은 8번 모두 정답을 맞혔기 때문인데요, 따라서 가설검정의 결과 '통계적으로' 밀크티를 구별할 수 있다는 여인의 주장이 참이라는 것을 의미합니다. 즉, 그 여인은 정말 영국의 대장금이었던 것입니다!

 

■ 마치며 

 

사실 머피의 법칙의 실제 주인공인 머피 대위는 모든 일에서 사소한 부주의로 인해 안 좋은 결과가 일어날 수 있음을 경고하고자 머피의 법칙을 만들었다고 합니다. 즉, 안 좋은 일이 일어날 원인을 사전에 줄이자는 취지였다는 것인데요, 그렇다면 우리는 이와 같은 머피 대위의 뜻에 따라 안 좋은 일이 일어난 뒤 머피의 법칙을 탓하기보다는좋은 일이 일어나지 않도록 방지하고 반대로 좋은 일이 일어날 확률을 높일 수도 있지 않을까요? 그리하여 '일어날 법한 일이 일어난다'는 통계학의 직관처럼 좋은 일이 일어날 확률을 높여 좋은 일이 연달아 일어나길 기대해 볼 수도 있지 않을까요?

 

영화 속에서 쿠퍼는 '일어날 일이 일어난다.'라고 말하면서도 머피와의 재회를 위해 끝까지 포기하지 않는 모습을 보여줍니다. 그리고 5차원 속에서 기적같이 살아나오면서 자신을 도와주는 '기적의 손길'이 바로 '우리'였다는 의미심장한 말을 하는데요, 어쩌면 이와 같은 포기하지 않는 쿠퍼의 노력이 스스로를 '기적'으로 이끄는 확률을 높여줬던 것일지도 모르겠습니다.

 

※ 본 글은 '통계청블로그기자단'의 기사로 통계청의 공식입장과 관계가 없습니다.


 

신고
트랙백 TRACKBACK :0 개, 댓글 COMMENT :0 개가 달렸습니다.
트랙백 TRACKBACK :0 개, 댓글 3 개가 달렸습니다.
  • 김희용 2014.06.11 13:43 신고 ADDR EDIT/DEL REPLY

    머피의 법칙 의미를 잘 알았습니다.

  • BlogIcon 박경희 2014.06.13 21:23 신고 ADDR EDIT/DEL REPLY

    잘봤습니다~

  • 권상희 2014.06.14 09:32 신고 ADDR EDIT/DEL REPLY

    재미있고 쉽게 잘봤어요 ㅎㅎ


티스토리 툴바