hot topic


통계에 있어 가장 많이 접하는 것이 무엇일까요? 바로 '분포'라는 친구입니다. 분포는 무엇을 말하는 것일까요? 분포는 쉽게 말해서 자료들의 퍼짐을 말하며. 그림을 통해 쉽게 이해해볼까요? 


퀴즈 성적에 따른 인원 분포

다음은 100명을 대상으로 5문제의 퀴즈를 풀게 한 후, 그 결과를 나타낸 표입니다. 각 갯수 마다 다른 수의 사람들이 퍼져있는 것을 볼 수 있지요? 맞춘 문제 수(변량)마다 사람들의 수(도수)이 다르게 퍼져 있는 것, 이것이 분포의 가장 쉬운 예입니다. 

사실 우리는 학교를 다니면서 분포공부를 어느정도 했습니다. 고등학교때 우리는 정규분포와 이항분포라는 것을 배웠지요. 그런데 우리가 고등학교때 배우고 쓰던 이 분포들을 수능 한 두 문제를 맞추기 위해서 배운 것일까요? 전혀 그렇지 않습니다! 우리가 배운 분포들은 책장 밖으로나와 실생활에서도, 공장에서도, 연구실에서도 굉장한 활약을 하고 있답니다. 과연 통계분포들은 우리의 생활 속에 어떠한 도움들을 주고 있을까요? 지금부터 그 친구들을 소개하겠습니다.:)



1.성공과 실패, Yes or No에 대해서는 이항분포

                                                                                                        

우리가 고등학교 들어와서 맨 처음으로 배우는 분포이지요? 우선 식부터 보도록 하겠습니다.

우리가 배운 이항분포식입니다. 기억이 새록새록 나시나요? 식에서 볼 수 있듯이 이항분포는 한마디로 말해서, 예와 아니오를 다루는 분포라고 할 수 있겠습니다. 성공과 실패, yes or no와 같은 두 반대되는 결과에대한 문제는 대부분 이항분포를 통해 해결할 수 있다는 뜻이지요! 무슨 말인지 예를 통해 알아볼까요?


영수는 패널티킥을 80%의 확률로 성공시킨다. 그럼 10번의 패널티킥을 찼을때, 영수가 7번 넣을 확률은?

고등학교 때 많이 풀어봤던 것 같은 문제이지요? 그 때의 추억을 되살리며 한 번 풀어보는 재미를 드리기 위해 답은 긁어서 볼 수 있게 해놓았습니다.:) (답: 0.2013 ). 이런 가상적인 상황말고 실생활에 쓰이는 예로는 신약개발의 치료율에 관한 조사, 공장에서의 불량율 조사와 같은 경우에 널리 쓰이고 있습니다.




2.세상을 설명하는 기똥찬 곡선, 정규분포

                                                                                                        

고등학교에서 두번째로 배우는 분포이고, 통계학의 척추와도 같은, 그만큼 가장 중요하고 널리쓰이는 분포! 바로 정규분포입니다. 식은 이렇게 생겼습니다.

굉장히... 복잡하죠? 이 식은 좀 더 깊게 공부해야 알 수 있는 식이기 때문에 자세히 설명은 못드리겠습니다. 대신, 다음 그림을 보죠!


[출처: 구글이미지]

이제 좀 친숙한 그림이 나왔나요? 이 종모양의 그래프는 바로 위의 복잡한 식을 그래프 위에 표한한 것으로 정규분포 그래프가 되겠습니다. 정가운데 솟아 오른 곳이 바로 평균이고, 평균 양쪽으로 데칼코마니처럼 대칭 되는 정갈한 모양을 하고 있습니다. 이 그래프를 많은 학자들은 '세상을 설명하는 곡선'이라고 말합니다. 그만큼 우리 세상에 일어나는 수많은 일을 설명하는 도구가 바로 이 그래프이지요. 좀 과장을 보태자면 이 정규분포가 없으면 통계학은 존재할 수가 없습니다. 대체 왜 과장해서 강조할 정도로 이 정규분포라는 친구가 중요한 것일까요? 

바로 심극한정리라는 개념 때문입니다. 중심극한정리를 가장 쉽게 설명하자면, 우리가 조사하고자 하는 것에 대한 자료를 수집하면 할 수록 자료들의 분포가 정규분포에 가까워진다는 것입니다. 그렇기 때문에 앞에 나온 이항분포나 다른 많은 분포들도 수가 많아 질수록 정규분포를 따른다던지, 아니면 정규분포의 특수한 경우, 변형한 경우로서 정규분포와 깊게 연관되어있습니다.

앞서 설명드린대로 정규분포가 쓰이는 예는 무궁무진하지만 가까운 예를 간단히 들어볼까요? 수능 성적표의 표준점수가 바로 그러합니다. 왜 깔끔하게 100점 만점으로 나타내지 않고 표준점수라는 의아한 점수를 두었을까 궁금하신 독자분들이 많았을텐데요! 표준점수는 바로 상대평가를 더 엄격히 하기 위해 정규분포의 원리를 이용한 산물입니다. 만약에 국어가 영어보다 훨씬 어렵게 출제되었다면, 국어 100점은 영어 100점보다 더 높은 가치를 지닙니다. 그 가치를 표준점수라는 것으로 나타내어 성적을 더욱 엄밀하고 합리적으로 평가할 수 있는것이지요.



3. 다음 일은 언제쯤 일어날까? 시간을 알려주는 지수분포

                                                                                                        

이번에는 기존에 배우는 것이 아닌 통계학과 학부과정에서 배우는 분포 하나를 소개해드리겠습니다.


식의 모양은 다음과 같이 비교적 간단하고, 그래프는

이와 같이 오른쪽으로 갈수록 작아지는 형태가 됩나다. 지수분포의 쓰임새는 간단히 말해 시간을 측정하는 분포입니다. 시간당 몇번 일어나는지의 정보만 알고 있으면, 다음 일이 일어나는 데에 걸리는 시간을 알아낼 수 있도록 하는 분포이지요! 실제로 지수분포는 특정한 공정이 걸리는 시간, 효율적인 업무관리를 위해 시간에 대한 정보를 알고자 할 때 등, 시간에 관련된 문제 해결에 널리 쓰이고 있습니다.



이외에도 많은 분포들이 있지만, 가장 널리쓰이는 것들을 모아 소개해드렸습니다. 어떠셨나요? 통계를 알면 살아가는데 굉장히 도움이 될 것 같지요? 통계학이 분명 괴롭고 머리아프긴 하지만, 통계를 알면서 더 많은 생각을 할 수 있게 되어 기쁨과 보람을 많이 느낍니다. 앞으로도 제가 배운 통계, 여러분에게 좀 더 알차게 전해드리는 기자가 되겠습니다! ^^


 ※ 본 글은 '통계청블로그기자단'의 기사로 통계청의 공식입장과 관계가 없습니다. 



신고
트랙백 TRACKBACK :0 개, 댓글 COMMENT :0 개가 달렸습니다.



‘한국 작년 4분기 성장률 4% OECD 최고’


‘한국은행 기준금리 동결 10개월 연속 2.50%



요즘 TV나 인터넷 기사를 보면 심심치 않게 볼 수 있는 기사 제목입니다. 우리는 많은 지표와 지수를 통해 정보를 주고받습니다. 수업시간에 경제를 배우면서, 신문을 보면서 끊임없이 경제지표와 지수를 보게 됩니다. 경제지표는 특정 경제현상을 통계수치로 나타낸 것으로, 그중 소비자물가지수(CPI)․생산자물가지수(PPP), 경기종합지수(CI) 등과 같이 ‘지수’로 끝나는 지표를 많이 활용하고 있습니다.



▶ 지표와 지수


일반적으로 비교하고자 하는 대상은 같으나 시점이 다른 경우, 기준의 수치를 잡고 대상이 얼마나 증가 또는 감소했는지 알아보는 데 지수를 활용합니다. 이때 지수가 물가나 경기와 관련이 있는 것이라면 그 지수는 경제지수가 되는 것입니다. 우리나라의 대표적인 경제지수로는 소비자물가지수(CPI), 생산자물가지수(PPP), 경기종합지수(CI)가 있습니다. 이 중 소비자물가지수(CPI), 경기종합지수(CI)는 통계청에서 일정 시간마다 발표하고 있습니다.

 


KOSIS국가통계포털 100대 지표 중 경기·물가 관련 지표

<자료 출처:KOSIS http://kosis.kr/>


통계청에서는 위의 지표 이외에도 다양한 자료를 월, 분기, 년 등 정해진 기간마다 발표하고 있습니다.


소비자물가지수란 소비자가 일상 소비생활에서 구매하는 상품 및 서비스의 가격변동을 나타내는 지수로 소비자의 평균적인 생계비용이나 화폐의 구매력 변동 등을 측정할 수 있답니다. 예를 들어 2010년을 기준(100) 하였을 때 2014년 현재 소비자물가지수가 108이라면 2014년의 물가가 2010년에 비해 8% 상승했다고 해석할 수 있겠습니다.


 

지표는 기준을 중심으로 필요한 정보를 간단하면서 정확하게 알려준다.

<사진 출처 : 네이버 블로그 "경제놀이터">



▶ 어렵고 복잡하기만 한 지표와 지수


위에서 예를 든 지수에 대해 이해를 잘한 사람들도 있겠지만 경제 관련 지식이 독자라면 다소 어렵게 느낄 수 있을 겁니다. 또 이해했을지라도 위와 관련된 지표가 더 복잡해지거나 내용이 늘어나면 그것을 이해하기란 쉽지 않을 수도 있습니다. 이런 경우에 많은 사람이 복잡해진 내용을 이해하려 하지 않거나 간과해버려 중요한 정보를 놓쳐버리는 현상이 발생할 수 있습니다.


따라서 지표와 지수는 함축된 다량의 정보만을 전달하기 보다는 많은 사람들에게 이해하기 쉽게 만들어질 때 그 의미성이 더 잘 전달된다고 할 수 있겠습니다.

 

지나치게 많거나 어려운 지표는 도리어 정보에 대한 이해를 방해할 수 있다.

<사진 출처: 네이버 블로그 "First Dream">



한눈에 알아볼 수 있는 지표를 활용하기


빅맥(Big Mac)으로 세계 물가 비교하기

전 세계적으로도 경제를 비교하는 여러 가지 지표, 지수가 있습니다. 그 가운데 빅맥지수․스타벅스지수․코카콜라지수 처럼 많은 사람에게 친밀하게 접근되고 이해하기 쉽도록 제공되는 정보도 있습니다. 특정 브랜드나 상품의 가격을 기준으로 각국의 물가 수준이나 환율을 비교함으로써 사람들에게 더 흥미롭고 효과적으로 정보 전달이 가능하다는 점에서 매우 유용한 지표라고 할 수 있겠네요.

 

<사진 출처 : 맥도날드>

 

 

그 중 대표적인 빅맥지수(Big Mac Index)에 대해 간략히 알아보도록 하겠습니다. 빅맥지수(Big Mac Index)는 맥도날드의 빅맥을 이용하여 각국 화폐의 구매력을 비교하는 대표적인 지수로, 1986년 이래 정기적으로 발표되고 있습니다. 나라별 빅맥의 품질이 동일하고, 빅맥의 가격 차이가 없어야 한다는 가정하에 각 나라의 통화 구매력을 나타내주는 지표로 환율, 구매력, 통화에 대해 문외한인 사람이라도 이 지수를 쉽게 이해할 수 있다는 점에서 세계 경제를 설명해주는 매력적인 지표가 될 수 있겠습니다.



  <자료출처 : The Economist 2014년 2월>


<표1>에서 우리나라의 빅맥 가격은 3.47달러(3,700원)로 미국과 빅맥의 품질과 동일하다고 가정하면 1.15달러를 더 줘야 미국에서 빅맥을 살 수 있다는 것을 알 수 있습니다. 즉, 빅맥지수를 통해 해당 국가의 통화가 달러와 비교해 높게 평가되는지 낮게 평가되는지 쉽게 알 수 있습니다.

 



<자료출처 : The Economist 2014년 2월>

 

실제로 <표2> 빅맥지수에서도 한국의 통화가치가 미국보다 25.5% 저평가 되었다고 나타내고 있습니다. ‘원화 평가절하’, ‘달러 평가절상’ 등 듣기만 해도 어렵고 전문적인 용어를 굳이 사용하지 않아도 더 확실한 정보전달을 볼 수 있습니다. 이처럼 빅맥지수는 일상 상품에 대한 구매력을 기준으로 실제 책정된 환율의 수준을 간단하면서도 이해하기 쉽게 알려 준다는 점에서 유용한 지수라고 할 수 있습니다.


▶ 숫자에 약한 사람들을 위한 매뉴얼…정보전달의 중요성


‘빅맥지수’에 이은 ‘맥주 지수’ 개발

  

<사진 출처 : Doopedia>


최근에 국제노동기구(ILO)에서 공개한 각국의 최저임금을 기준으로 ‘맥주지수’ 라는 흥미로운 지수가 공개되었습니다. 최저임금을 기준으로 몇 시간 일해야 맥주 한잔(500ml)을 마실 수 있는지 알려주는 지수로 각국의 경제사정을 짐작해볼 수 있는 매뉴얼이라고 하는데요.


 

<자료출처 : The Economist 2014년 2월>

 

최근 발표되는 자료나 지표를 유심히 살펴보면 점점 간소화되어 가는추세를 볼 수 있는데요. 정보를 전달하는 것조차 경쟁인 요즘 주어진 정보를 많은 사람들에게 어떻게 하면 간단하고 정확하게 전달할 수 있을지에 여러분들도 그 중요성에 대해 생각해보았으면 좋겠습니다.

 

※ 본 글은 '통계청블로그기자단'의 기사로 통계청의 공식입장과 관계가 없습니다


신고
트랙백 TRACKBACK :0 개, 댓글 COMMENT :0 개가 달렸습니다.

[2013년 5월 소비자물가 동향]


최근 경기불황으로 인해 물가에 대한 관심이 무척 높아진 것 같습니다. 물가가 올라도 문제, 너무 안 올라도 문제라고 하니 헛갈리기도 하구요^^; 오늘은 통통이가 5월 소비자물가 동향을 소개하면서 저번 달, 저번 년의 비교를 통해 쉽게 설명드리고자 합니다~!



< 소비자물가지수 및 전년동월비 등락률 추이 >


결론부터 말씀을 드리는 게 좋을 것 같군요:) 2013년 5월 소비자물가지수는 107.3으로 전월대비 변동이 없었습니다. 107.3이라는 숫자가 어떻게 나왔냐 하면요~ 2010년 소비자물가지수를 100으로 환산하여 비교한 수치랍니다.


2013년 4월이 아닌 전년동월대비(2012년 5월)로는 1.0% 상승했으며 2012년 11월의 1.6% 상승 이후 7개월 연속 1%대 상승세를 유지하고 있습니다. 상승폭이 작다라고 생각되시죠? 


소비자물가지수 중에서도 생활물가지수라는 걸 조사하고 있습니다. 생활물가지수는 체감물가를 설명하기 위해 구입 빈도가 높고 지출비중이 높아 가격변동을 민감하게 느끼는 142개 품목으로 작성한 지수인데요~ 생활물가지수는 전월대비 0.4% 하락, 전년동월대비 0.2% 상승했습니다. 특히 식품은 전월대비 0.6% 하락, 전년동월대비 0.6% 상승했습니다. 




소비자물가지수를 지출목적별로 자세히 살펴보겠습니다. 전월과 비교하여 의류 및 신발부문과 기타상품 및 서비스부문은 1.5%씩 상승했고 오락 및 문화부문은 0.4% 상승, 주택, 수도, 전기 및 연료부문과 보건부문은 0.2%씩 상승, 통신부문, 교육부문 및 음식 및 숙박부문은 0.1%씩 상승했습니다. 위의 표를 보시면 좀 더 쉽게 이해하실 수 있을 것 같네요^_^


주류 및 담배부문과 가정용품 및 가사서비스부문은 변동이 없으며 교통부문은 1.3% 하락, 식료품 및 비주류음료부문은 0.8% 하락했습니다.


전년동월대비로는 교통부문은 2.6% 하락, 가정용품 및 가사서비스 부문과 기타상품 및 서비스부문은 0.5%씩 하락했습니다. 통신부문은 변동이 없으나, 주택, 수도, 전기 및 연료부문 3.9% 등 나머지 부문은 모두 상승했네요.


전체적으로 본다면 저번 달에 비해 의류 및 신발, 음식 및 숙박 물가가 많이 올랐지만 작년 이 맘 때쯤에 비하면 주택,수도,전기 및 연료 물가가 가장 많이 올랐다고 볼 수 있겠습니다:)


물가의 변동이 전국적으로 평이하게 나타나지는 않겠지요? 16개 광역시도별로 전월대비 소비자물가 동향을 보면, 제주 0.2% 상승, 충북 0.1% 상승, 경기, 강원, 전남, 경북 4개 시도는 0.1%씩 하락, 나머지 10개 시도는 변동이 없었습니다. 이 수치들을 공공 및 개인서비스로 나눠서 본다면 어떻게 될까요? 아래 표를 보시죠!



< 16개 광역시도별 공공 및 개인서비스 동향 >


16개 광역시도별 공공서비스부문의 전월대비 소비자물가 동향은 강원은 0.7% 상승, 제주는 0.2% 상승, 대구와 충남은 0.1%씩 상승, 나머지 12개 시도는 변동이 없었습니다. 그런데 공공서비스 물가는 대체 뭐지? 하고 궁금해 하실 분을 위해 살짝 설명드리겠습니다. 말 그대로 공공을 위한 서비스를 말하구요 그 서비스를 이용하는데에 필요한 가격 수준을 말합니다. 하수도료, 시내버스료, 입원진료비, 대학교납입금 등이 이에 속합니다.


반대로 개인서비스 부문은 공동주택관리비, 학원비, 보육시설이용료 등을 말합니다. 개인서비스 부문에서는 광주와 대전은 0.4%씩 상승, 부산, 대구 등 8개 시도는 0.3%씩 상승, 서울 인천 등 6개 시도는 0.2%씩 상승했네요. 전반적으로 공공서비스보다는 개인서비스의 물가가 조금 더 상승한 것 같습니다.


이제까지 2013년 5월 소비자물가 동향을 살펴봤습니다. 여러분이 체감하는 물가와 비슷하신가요^^? 가계부에 적으셨던 물가와 다음에 나올 6월 소비자동향 결과와 비교해보는 것도 좋을 것 같습니다. 




신고
트랙백 TRACKBACK :0 개, 댓글 COMMENT :0 개가 달렸습니다.

티스토리 툴바