hot topic

[통계청 기자단] 통계가 전하는 거짓말 


 세상에는 세 종류의 거짓말이 있다고 합니다. 거짓말, 새빨간 거짓말 그리고 통계! 

마크 트웨인은 영국 빅토리아 왕조에서 총리를 지낸 벤자민 디즈레일리의 말이라면서 이런 유명한 풍자를 남겼습니다. 통계는 사태의 숨겨진 핵심을 드러내는 데 효과적인 도구이지만 그만큼 사람들을 속이는 데도 효과적인 도구입니다. 따라서 이 책은 통계의 생산자 및 전달자들의 오류와 왜곡을 경계하고, 통계정보의 수용자들이 통계를 비판적으로 읽을 수 있도록 조금이라도 도움을 주고자 쓰여졌습니다. 이 책은 통계를 악용하면 어떻게 현실을 호도할 수 있는지, 우리나라의 실제 사례를 들어 유형별로 정리한 것입니다. 그리고 이 책에 실린 사례들은 대부분 언론을 통해 보도됐던 내용들이라고 합니다. 총 50가지의 내용으로 구성되어있고, 흥미로운 제목이 많이 보이는데요. 그 중 7가지 이야기를 요약해 보았습니다.

 


- 우리는 왜 숫자에 현혹되는가?

 우리는 하루에도 수많은 숫자를 만납니다. 기온과 비 올 확률, 비가 온다면 예상 강우량이 얼마인지를 보고 들으며 우리는 하루 일과를 시작합니다. 신문이나 뉴스에 채워져 있는 많은 통계수치들은 세상이 지금 어디로 흘러가고 있는지를 보여주고 주가, 부동산 가격, 금리, 경제성장률, 가계소득 등 경제 정보들 또한 숫자 투성이 입니다. 이렇게 수치화된 정보에 너무도 익숙해져 있어서, 우리는 숫자로 나타내지 않은 정보들을 머리에서 처리하는 데 오히려 어려움을 겪기까지 합니다. 우리의 이런 모습을 생텍쥐페리는 <어린왕자>에서 이렇게 풍자하기도 했습니다. 


  어른들은 숫자를 좋아한다. 새로 사귄 친구 이야기를 할 때면 그들은 가장 중요한 것은 도무지 묻지 않는다. “그 애 목소리는 어떻지? 그 앤 어떤 놀이를 좋아하니? 나비를 수집하니?” 라는 말을 그들은 절대로 하지 않는다. “그 앤 몇 살이니? 형제는 몇이고? 몸무게는? 아버지 수입은 얼마야?” 하고 그들은 묻는다. 그러고서야 그 친구가 어떤 사람인지 알게 된 줄로 생각하는 것이다.

 만약 어른들에게 “창가에는 제라늄 화분이 있고 지붕에는 비둘기가 있는 장밋빛 벽돌집을 보았어요” 라고 말하면 어른들은 그 집이 어떤 집인지 상상하지 못한다. 어른들에게는 “10만 프랑짜리 집을 보았어요” 라고 말해야만 한다. 그러면 그들은 “야, 근사하겠구나!” 라고 소리친다. 


 여기에는 우리가 언제부터 오로지 숫자로 세상을 읽게 되었는지, 그리고 우리는 왜 숫자에 현혹되는지에 대한 뒷 이야기가 나와 있습니다. 



- 숫자 풀어쓰기             

 애플의 최고경영자인 스티브 잡스프레젠테이션에서 숫자를 잘 이용하는 것으로 유명합니다. 이를테면 이런식입니다. 잡스는 “지금까지 아이폰 400만 대가 팔렸다”고 말하는 데 그치지 않고 “하루 평균 2만대 꼴이죠”라고 덧붙인다. 추상적인 숫자를 사람들이 쉽게 알아챌 수 있는 다른 숫자로 바꾸어 표현하면 설득력이 높아지는 것입니다. 잡스식 숫자활용은 다른 곳에서도 쉽게 볼 수 있습니다. 주류회사인 진로는 2008년, 참이슬 프레시 광고문구에 다음과 같이 썼습니다. 

 “참이슬 프레시-국내 최단기간, 최다량 10억 병 판매 돌파. 초당 23병, 17개월 만에 10억 병 판매 돌파를 이뤄냈습니다.”

 17개월 만에 10억 병을 팔았으니 ‘대히트’인 것 맞습니다. 하지만 이보다는 광고문구의 ‘초당 23병이 팔렸다’는 내용이 눈길을 확 끕니다.  

 숫자 풀어쓰기의 마력을 유감없이 보여준 글로, 버나드 라운이 1986년 유네스코의 기관지 <유네스코 꾸리에>에 쓴 글을 들 수 있습니다. 


 “오늘날 세계 경제의 위기는 부족한 자원을 군사부문에 집중시킨 결과이다. 매트로놈의 은유를 사용해 보자 (중략) 진동 소리는 2초마다, 한 어린이가 영구 장애를 입어 여생을 불구로 살아야 하는 운명에 처하고 있음을 알려준다. 결국 메트로놈이 한 번 진동할 때마다 한 어린이는 죽거나 불구가 되고 있는 셈이다. 첫 번재 원자탄이 앗아간 목숨과 같은 숫자이 12만 명이 사흘마다 죽어가고 있다. (중략) 매초 울리는 메트로놈의 진동 소리는 우리에게 세 번째 메시지를 전한다. 현재 지구상에 존재하는 핵무기는 TNT로 환산할 때 약 160억 톤 규모에 이른다. 메트로놈이 한번 진동할 때마다 TNT 1톤이 터진다면, 우리는 그 폭발소리를 500년 동안 계속 듣게 될 것이다.” 


 문제는 이런 비유들은 수치를 있는 그대로 보여주는 것이 아니라 나름대로 가공한 것이라는 데 있습니다. 듣는 사람에게는 또렷하게 각인시키는 효과가 있지만, 비유를 만들어내는 사람이 약간을 조작을 가해도 쉽게 알아차리기가 어렵습니다. 



- ‘이태백’의 진실

 이태백, 삼팔선, 사오정, 오륙도, 우리나라의 불안정한 고용 사정을 비유한 조어들입니다. 이런 조어는 강한 인상을 주기 위해 현실을 어느 정도 과장하게 마련입니다. 그런데 이런 표현이 일반화되면 ‘과장’이 아니라 ‘실제 현실’인 것처럼 느껴지기도 합니다. 

 ‘이태백’이란 표현이 언론에 처음 등장한 것은 2003년 무렵이었습니다. 당시 20대 가운데 취업한 사람의 비율은 60.2퍼센트였습니다. 이를 보면, ‘이십대 태반이 백수’라는 표현은 실제 고용 현실과는 제법 큰 거리가 있습니다. 연도별 20대 고용률 추이를 보면 2000년 이후 뚜렷한 특징을 찾기는 어렵습니다. 오르내림은 있지만 뚜렷하게 좋아지지도 나빠지지도 않았습니다. 

 20대 취업자 수가 줄어드는 이유는 간단합니다. 20대 인구가 계속 감소하고 있기 때문입니다. 따라서 고용사정에 별 변화가 없을 경우, 20대 취업자 수가 줄어드는 것은 당연한 일입니다. 그럼에도 이런 정보는 전혀 전달하지 않은 채 “청년 취업자 수가 계속 감소하고 있다”는 것만 강조하면 독자들은 청년 취업난이 점점 심화되고 있다고 믿기 쉽습니다. 



- 평균의 함정, 경제학자들의 거짓말, 평균의 함정 벗어나기

 평균기온이 20도인 지역은 사람이 살기에 아주 좋을 것 같은 느낌을 주지만 밤 기온이 영하 20도, 낮 기온이 영상 60도인 경우에도 평균기온은 20도입니다. 그런 곳에서 사람이 살기는 어렵습니다. 그리고 평균(산술평균)에는 단순평균과 가중평균이 있습니다. 평균이라고 하면 대개는 단순평균을 말하지만, 단순평균을 써서는 안 될 때가 있습니다. 또한 평균은 의심스런 통계수치입니다. 평균이란 포장지를 벗겨내고 구체적인 개별 수치를 살펴야 사태를 제대로 파악할 수 있는 경우가 적지 않습니다. 

 


- 너무도 당연한 ‘사상최고’

 기자들은 ‘사상최고’, ‘사상최저’라는 표현을 좋아합니다. 사상최고만은 못하지만, 몇 년 만의 최고치란 표현도 좋아합니다. 그야말로 새로운 것이고 사람들의 눈길을 끌기 쉽기 때문입니다. 그러나 새로 나온 수치가 사상 최고치인 게 지극히 당연한 경우도 적지 않습니다.

 우리나라 인구는 앞으로도 꽤 오랫동안 해마다 사상최대가 됩니다. 연간 사망자보다 출생아 수가 더 많은 까닭입니다. 통계청 인구추계로 보면, 2008년 우리나라 인구는 4860만 명입니다. 인구는 2018년 4934만 명까지 완만한 증가세를 이어가다가 이후 감소세로 접어들 것으로 전망되고 있습니다. 그러므로 2018년까지는 해마다 “올해 인구는 사상최대”가 될 것입니다. 인구가 늘어나는 데 따라 경제활동인구나 취업자 수, 임금근로자 수 역시 늘어날 것입니다. 따라서 경기 상황이 급격히 나빠질 때를 제외하곤 그 수치가 해마다 사상최대치를 경신해갈 가능성이 큽니다. 특히 노인인구가 증가하면서 노인 경제활동인구나 노인 취업자 수는 꾸준히 늘어날 것입니다. ‘사상최대’가 되는 게 당연하고, 그렇지 않으면 오히려 특별한 상황이 벌어졌음을 뜻하게 됩니다. 

 또한 가계 밎이 해마다 늘어난다는 것만으로는 뉴스거리도 아니고 문제될 일도 아닙니다. 가계의 경제규모가 커짐에 따라 가계는 대출받을 여력이 커지고, 대출을 활용해 경제활동을 하는 일도 늘어나기 때문입니다. 따라서 가계대출이 해마다 사상최고치를 경신하는 것은 이상할 게 없습니다. 가계 빚이 또 사상최고치를 경신했다는 뻔한 이야기보다는, 가계의 대출 잔액이 가계 소득에 견줘 얼마나 되는지, 가계의 이자 지출액이 소득에서 얼마를 차지하는지 연도별로 살펴보는 게 훨씬 중요합니다. 



- 작성기관에 따라 다른 통계 읽기

 비슷한 사안에 대한 통계인데도 통계 작성 기관에 따라 수치가 다른 경우가 있습니다. 통계를 작성하는 목적이 서로 다르고, 이 때문에 조사나 집계 방법이 다르기 때문입니다.

 통계청이 발표하는 소비자물가지수의 ‘집세’ 항목은 현실을 제대로 반영하지 못한다는 지적을 자주 받는 것 가운데 하나입니다. 국민은행이 매달 집계하는 주택전세가격 지수와 비교하면 상승률이 매우 낮게 나오곤 하기 때문입니다. 2006년 국민은행 통계를 보면, 그해 연말을 기준으로 주택전세 가격은 전년 말에 견줘 6.5%가 올랐습니다. 그런데 통게청의 소비자물가 품목별 지수 상승률을 보면 집세는 겨우 0.7% 상승에 그친 것으로 나타납니다. 왜 이렇게 차이가 큰 것일까요? 통계를 작성하는 방식에 큰 차이가 있기 때문입니다.

 국민은행 통계는 표본가구의 전세금이 오르면, 같은 단지의 같은 평수 아파트는 모두 전세금이 오른 것으로 보고 지수를 산출합니다. 이는 국민은행의 통계가 ‘전세금’의 흐름을 신속하게 보여주기 위한 것이기 때문입니다. 그러나 소비자물가지수 통계에서는 전국 5000여 표본가구 가운데 전세계약이 갱신돼 실제로 전세금이 오른 표본가구에 대해서만 전세가격 변동으로 인한 가계 지출의 변화를 지수에 반영합니다. 소비자물가 통계는 전세금의 흐름이 아니라 가계의 실질지출이 어떻게 변하는지를 보여주는 데 목적이 있는 까닭입니다. 


 

두 통계를 비교해서 살펴보면, 각각의 특징이 잘 드러납니다. 가격 변동을 보여주는 국민은행 통계는 반응이 바르고, 출렁거림도 큽니다. 이에 견줘, 통계청 통계는 국민은행 통계보다 1~2년 후행하는 모습을 보이고, 변동폭도 상대적으로 작습니다. 

  어느 한쪽이 옳고, 다른 한쪽이 잘못된 것은 아닙니다. 각각의 통계 조사가 보여주는 것이 무엇인지 정확히 알고, 적합한 통계를 쓰는 것이 중요합니다. 



- 뒤집힌 인과관계

 2006년 9월, 한 신문은 <빈곤층 계속 는다>는 제목으로 이런 내용의 기사를 실었습니다. 


 서민이익을 대변한다는 참여정부에 들어서도 빈곤층이 늘어나고 있는 것으로 들어났다. 이같은 사실은 보건복지부의 ‘국민기초생활보장 수급자 현황’이라는 보고서에서 3일 확인됐다. (중략) 2001년 141만 9000명이던 기초생활보장수급자는 2003년 참여정부 출범 후에도 증가세가 이어져 지난해 151만 3000명까지 늘어났다. 


 기사는 기초생활보장 수급자가 4년 사이 10만 명 가까이 늘어난 것을 놓고, 빈곤층이 증가하고 있는 것이라고 설명합니다. 기초생활보장 수급자는 분명 빈곤층에 속합니다 .하지만 기초생활 보장 수급자의 증가는 빈곤층이 증가한 것이라기보다는 빈곤층 가운데 정부의 재정보조를 받는 사람이 늘었음을 보여주는 통계일 뿐입니다. 정부가 기초생활보장 수급 대상을 확대한 것이 수급자의 증가로 이어졌다는 게 더 옳은 해석일 것입니다. 



 마지막으로, 이 책을 읽다보니 작가가 한 말 중 중간중간 통계가 전하는 거짓말에 속지 않는데 도움이 되는, 좋다고 생각되는 게 있어서 옮겨 적어보았습니다. 


 통계를 제대로 읽으려면 그것이 제대로 만들어졌는지 따지는 것도 중요하지만 누가 만들었는지, 왜 만들었는지도 함께 살펴야 합니다. 아무 뜻 없이 재미삼아 통계를 만드는 경우란 없기 때문입니다. 

 통계는 이리 저리 뜯어보고, 깊이 들여다보면 언뜻 봐서는 볼 수 없었던 새로운 것을 드러내 보여줍니다. 그럼에도 그것이 ‘거짓말의 도구’로 자주 비난받는 것은 통계를 이용하는 사람에게 문제가 있기 때문입니다. 

 모든 통계는 의심해야 합니다. 국가기관이 낸 통계라고 해서 예외가 될 수는 없습니다. 특히 별도의 국가통계가 있음에도 불구하고 이해 당사자가 따로 발표한 통계는 더욱 의심해야 합니다. 설령 그 통계가 전문기관의 손을 거친 것이라 할지라도.




정남구 지음



※ 본 글은 '통계청블로그기자단'의 기사로 통계청의 공식입장과 관계가 없습니다

저작자 표시
신고
트랙백 TRACKBACK :0 개, 댓글 COMMENT :0 개가 달렸습니다.

[통계청 기자단] 숫자로 들여다보는 세상의 놀라운 이치 <짜통계학>


 안녕하세요? 여러분에게 통계학에 관한 책 한 권을 소개해드릴까 하는데요. 바로 김진호 저자의 <괴짜 통계학>이라는 책인데요. 이 책을 저술한 김진호 교수께서는 국방대학원 경영학과 교수로, 통계학에 관한 여러 가지 책을 출판하셨습니다. 



 이 책을 보니 <괴짜 경제학>이라는 책이 생각나는 분들이 있으실 겁니다. 경제학을 공부하는 학생이라면 한 번쯤은 읽어봤을 법한 <괴짜 경제학>은 어려운 경제학을 실생활에 적용하여 재미있게 설명함으로써 경제학 초보자들도 보기 쉽게 만든 책인데요. 위의 <괴짜 통계학> 역시 그와 비슷하게 통계학을 잘 모르는 사람이라도 쉽게 읽을 수 있습니다.


 이 책은 총 5장의 챕터로 이루어져 있으며, 숫자에 대한 무지 때문에 기본적인 통계학 원리를 악용하는 것에 속는 것을 경계하라는 내용을 담고 있습니다. 간단한 예로, 우리가 마트에서 물건을 살 때, 50%를 할인한 데에서 20%를 더 할인해준다고 하면 총 70%가 할인되었다고 생각하는데, 이는 단순한 숫자 덧셈으로 나온 결과이지만 사실은 원래 금액에서의 70%가 아니라 그에 훨씬 못 미치는 정도가 할인된 것을 알려주고 있습니다. 


 이 책에서는 숫자를 제대로 이해하는 것이 통계학을 이해하는 것의 첫걸음이 된다고 설명하고 있습니다. 숫자에 대한 무지 때문에 일어나는 많은 현상들을 설명하면서, 그것들에 속지 않기 위해서는 숫자를 제대로 알아두는 것이 중요하다고 저자는 말하고 있습니다. 

 이 책에서 다루는 흔한 통계학의 숫자 장난에 대해서 몇 개 예시를 들어보겠습니다.


 흔히 말하는 평균, 3가지나 있었어?

 흔히 우리가 평균이라고 말할 때 우리는 그 수치를 그대로 받아들여 이해합니다. 흔히 우리가 이해하는 평균은 수학적으로 산술평균이라고 하여, 모든 자료의 값을 다 더해 전체 수로 나눈 것입니다.


 1 1 2 3 1 3 4

위의 숫자의 산술평균은 위의 숫자를 모두 더해(15) 전체 수(7)로 나눈 평균 2.1입니다.


 하지만 우리가 주변에서 접할 수 있는 평균에는 산술평균만 있는 것이 아닙니다. 우리가 사용하는 평균에는 ‘중앙값’이라는 것도 존재합니다. 중앙값은 숫자들을 작은 수부터 큰 수 순서로 세워놨을 때, 중앙에 위치하는 값을 의미합니다. 중앙값을 이용하면, 다음과 같은 자료의 평균을 더 정확하게 측정할 수 있습니다.


 1 1 2 3 1 3 17

 위의 값의 산술평균은 17이라는 숫자 때문에 평균과는 약간 거리가 멀어 보이는 큰 숫자가 나오게 됩니다. 하지만 중앙값을 이용하면 숫자의 평균값을 효과적으로 대표할 수 있습니다.

 

 마지막으로 최빈수라는 평균이 있는데, 주어진 자료 중 가장 빈번하게 나온 숫자를 평균으로 택하는 것을 뜻합니다. 위에 숫자배열에서 보자면, 1이 가장 자주 등장하므로 최빈수는 1이겠죠.


 이렇게 평균의 개념이 3개로 나뉘기 때문에, 여기저기에서 어떤 데이터의 평균을 제시할 때 저 세 가지 중 본인에게 유리한 것을 선택해서 제시합니다. 그러므로 평균을 제시하는 데이터가 보일 때는 그냥 단순하게 받아들이지 말고, 저 세 개 중 어떤 평균의 계산법을 취하고 있는지 확인하여 어이없게 속는 경우를 방지해야 합니다.


 단순한 숫자 제시에만 속지 말고, 기준을 확실하게!

 사람들은 숫자에 약하므로, 숫자가 등장하면 무조건 맹신하는 경우가 많습니다. 이 책에서도 그러한 경우를 많이 제시하면서, 그러한 상황을 경계하라고 말하고 있습니다. 

 어느 한 연구 발표에서 가정 폭력에 대한 충격적인 결과를 보고한 적이 있습니다. 여자만 가정 폭력에 시달리는 것이 아니라, 남편들 중에도 무려 15%가 아내의 폭력에 시달린다는 것이었습니다. 하지만, 그 통계를 자세하게 들여다보면 아래와 같습니다.

 

남편의 폭력 경험

손,발, 몽둥이 사용:45.3%

닥치는 대로 때림:9.1%

칼 등의 흉기 사용:4.7%


아내의 폭력 경험

남편을 밀친다: 11.3%

물건을 던진다:7.0%

뺨을 때린다:2.6%

발이나 주먹 사용: 1.4%


 위에서 보면 남편이 아내에게 폭력을 행사한 것과 아내가 남편에게 행사한 것의 기준이 크게 다름을 알 수 있습니다. 위와 같은 기준을 살펴보지 않고 숫자에만 집착하면, 남편도 아내에게 15%나 폭력을 당한다고 한다는 발표에 속을 수 밖에 없고, 안 좋은 이해관계에 이용될 수도 있습니다.


 이 책은 이러한 것 외에도 수많은 통계적 데이터 들의 오류에 대해서 다루고 있습니다. 

 이 책이 이러한 수많은 오류들에 대해서 자세하고, 쉽고 재미있게 다루고 있다는 점은 굉장한 장점입니다. 덕분에 통계를 전혀 모르는 사람도 이 책을 쉽게 읽을 수 있다는 점에서 말입니다. 하지만, 한 가지 아쉬운 점은 5장이나 되는 방대한 내용 안에 알맹이는 아주 조금에 불과하다는 것입니다. 뒤로 갈수록 앞에 했던 내용이 똑같이 반복되거나, 심지어는 문장과 문단까지 똑같이 반복되는 경우가 있는데, 그렇기 때문에 핵심적인 책의 내용이 장수에 비해 현저하게 줄어들어 아쉬움이 남지 않았나 싶습니다.


어렵게 수식만 제시하는 복잡한 통계학 책을 멀리하고 싶다면, 통계학에 대해서 한 개도 모르는데 조금이라도 접해보고 싶다면, 더 이상 숫자놀음에 속는 것을 그만두고 싶다면, 이 <괴짜 통계학> 책을 읽어보는 것은 어떨지요! 



※ 본 글은 '통계청블로그기자단'의 기사로 통계청의 공식입장과 관계가 없습니다

저작자 표시
신고
트랙백 TRACKBACK :0 개, 댓글 COMMENT :0 개가 달렸습니다.

[통계청 기자단] 통계 속의 재미있는 세상이야기




구정화, 김찬호. 안병근. 이기원 저

 통계학적 문제해결 과정이란 input을 투입한 뒤 그 input이 프로세스를 거치면서 제어 가능한 변수들과 수많은 잡음의 영향을 받아 아웃풋으로 결과가 나오는 일련의 과정이다. 통계적 분석을 통해서 제어 가능한 변수를 예측 가능하도록 만들 수 있다면 변동(데이터)으로 야기된 많은 문제들을 해결할 수 있을 것이다.

'통계 속의 재미있는 세상이야기' 이 책에서는 이런 과정을 통해서 사회에서 일어나고 있는 다양한 일들을 원인을 찾아내고 과정을 분석하고 결과를 예측하는 내용을 담고 있다. 시사, 경제 도서라고 해도 무색할 만큼 경제적 내용이나 시사적 내용이 주제로 이루어져 있으며, 그 근본에는 통계를 사용하여 이야기를 풀어내고 있었다.


 

책은 총4부로 이루어져있는데 모두 줄글로 이야기를 하는 것이 아니라 만화 형식으로 이야기를 하는 부분도 많이 포함이 되어있었고, 그래프도 딱딱한 막대그래프들만 있는 것이 아니라 지루하지 않고 재미있게 책을 읽을 수 있었다. 


 "말발굽에 채어 죽은 군인은 얼마나 될까?"라는 에피소드에서는 평균값과 중앙값들이 어떤 상황에서 활용되어야 그 자료를 대표 할 수 있는지에 대해 이야기하고 있었다. 자료들 간의 퍼짐의 정도가 너무 크면 평균값이 의미가 없어지고 그 대신 중앙값을 이용하는 것이 전체자료를 대표하는데 더 효율적인 방법이라는 것을 알 수 있었다.


"우리의 취업 현장을 보니.." 에피소드에서는 근로 실제상황을 경제활동인구와 실업률을 통한 그래프로 보여주고 있었고, 종사상 지위별 취업자 구성비 변화와 학력별 임금 수준 등을 통계청에서 발췌한 통계적 자료를 바탕으로 이해하기 쉽게 삽화를 포함한 그래프로 설명해주고 있었다.


통계속의 재미있는 세상이야기 112P , 114P 발췌


"우리 반에 생일이 같은 아이가 있어요" 라는 에피소드에서는 한 반에 생일이 같은 아이가 있을 확률을 계산하는 방법과 그 반대의 확률을 계산하는 방법을 설명하고 있었다. 있다/없다 와 같은 이분법적인 확률의 계산 같은 경우 반대의 확률을 계산 할 때는 1에서 이전에 계산한 확률을 빼면 반대의 확률이 나오게 된다. 모든 확률의 합은 1이 되기 때문이다.


"나의 진짜 몸무게는?"라는 에피소드에서는 목욕탕에서 체중계를 이용해 몸무게를 재면서 측정오차와 표준편차, 평균값에 대해 설명해주었다. 같은 사람이지만 체중계에 올라갈 때마다 조금씩 체중 값이 변하게 되는데 이는 몸무게가 변한 것이 아니라 몸무게를 측정하는 기계에서 오차가 발생했기 때문이다. 이 같은 오차들을 고려한 대표 값을 구하기 위해서는 평균값이 필요하다. 평균값으로부터의 분포를 알아보기 위해서는 측정값과 평균값의 차이를 제곱한 분산을 계산해야 한다. 이와 같은 평균값과 분산 값은 회사 등에서 조사를 실행할 때 정확도의 척도가 되기 때문에 매우 중요한 개념이라고 설명하고 있다. 수식과 지루한 설명이 아닌 목욕탕에서 아버지와 아들의 자연스러운 대화로 통계에서 가장 핵심적인 개념인 평균과 분산에 대해서 알기 쉽게 설명해주고 있었다.

 

 통계학과에서 공부를 하고 있는 나는 교수님들께 항상 통계학적 Process를 따라 생각하고 모든 일을 해결하는 습관을 갖으라는 말을 가장 많이 들어왔다. 이 책은 원인을 통해 결과를 분석해서 예측가능한 생각의 과정, 즉 통계학적 Process를 정립하고 싶은 사람에게 큰 도움이 될 수 있는 책인 것같다. 뿐만 아니라, 사회의 이슈나 경제문제도 더 재미있게 이해할 수 있기 때문에 이 책 한권을 통해서 생각의 과정도 정립하고 시사상식까지 확립하는 두 마리 토끼를 모두 잡을 수 있을 것이다.



※ 본 글은 '통계청블로그기자단'의 기사로 통계청의 공식입장과 관계가 없습니다

저작자 표시
신고
트랙백 TRACKBACK :0 개, 댓글 COMMENT :0 개가 달렸습니다.

티스토리 툴바