hot topic


Q 통계정보학과를 지원하려는 학생들에게 통계정보학과에서 무엇을 배우는지 알려주신다면 어떤 것이 있을까요?

 

요즘은 데이터의 시대라고 하거든요. 수많은 데이터가 넘쳐나는 시대인데, 데이터를 과학적으로 처리하고 관리하고 분석하는 학문이 통계학이에요. 옛날에는 주로 데이터 분석과 처리를 수학적으로 했는데, 요즘은 컴퓨터가 발전해서 컴퓨터에서 쏟아져 나오는 데이터를 효과적으로 파악하려고 하죠.

 

디지털시대가 되니까 정부에서도 우리 국민의 생활과 연관되는 중요한 통계를 많이 만들어내고 있습니다. 그래서 이런 쏟아져 나오는 데이터를 이해하고 분석하고 관리하는 일을 하는 것이 통계학과에요.

 

Q 타과생이 봤을 때 통계학과가 과제도 많고, 어려운 프로그램을 다루는 것 같은데 실제로는 어떤가요? 

 

모르는 사람이 보면 어렵지만 본인이 전공이라고 생각하고 배우면 재미있죠. 의미없는 숫자같은데 그 속에서 정확한 사실들이 밝혀지고 그럴 때 학생들이 재미를 느낍니다. 자살률이 외국에 비해서 늘어나고 있다거나 또는 신생아 출생인구가 너무 줄었을 때 국가에서 미리 출산장려정책을 세우고, 이런 것들이 다 통계를 통해서 일어나는 일입니다. 그 통계를 만들어내고 통계를 통해서 사회를 예측하는 일이 중요하죠.

 

Q 통계정보학과 학생들이 이론만 배우는 것이 아니라 실제로 여론조사를 하기도 하나요?

 

수원대학교의 경우 통계조사연구소가 있어요. 학생들이 국가통계를 만드는 과정에 참여도 합니다. 통계조사연구소가 수원대학교에만 있는데 굉장히 활발하게 활동하고 있습니다.

 

Q 통계품질 심의위원을 하셨던데, 통계품질 심의위원은 무엇을 하나요?

 

우리나라 국가에서 공식적으로 발표되는 통계들이 제대로 작성되었는지를 심의하는 역할을 합니다. 대부분의 국가통계는 공무원이 작성하는데, 공무원은 통계의 전문가나 학자는 아니니까 옆에서 자문하고 도와주는 역할을 하죠. 


Q 통계청 홈페이지에 들어가서 보면 ‘이렇게 많은 통계를 통계청이 다 할 수 있나?’ 하는 생각이 드는데, 이런 통계자료들은 통계청에서 전부 만드는 것인가요?

 

통계청은 경제관련 기본통계를 만들고 각 부처에서 해당통계를 만듭니다. 예를들면,, 농식품부에서는 농림관련 통계를 만들고 문체부에서는 문화관련 통계를 만듭니다. 여기서 통계청이 제대로 만들 수 있도록 지원도 하고 관리도 합니다.

 

Q 여론조사를 하다보면 사람들이 귀찮으니까 하다마는 경우도 있는데 이런 경우는 어떻게 처리해야 할까요?

 

이것이 통계품질과 관련된 것인데, 그 사람들에게 충분한 협조를 구하거나 대가를 지불하고 정보를 얻어와야 하는데, 그저 막무가내로 가서 조사해달라 하는 경우, 응답 거절을 하거나 무성의하게 응답하잖아요. 제일 중요한 것은 통계청의 경우는 통계조사 요원들이 교육을 잘 받고 원칙대로 조사할 수 있도록 계속 관리해야하고, 그 다음에 필요한 예산을 들여야 합니다. 그럼에도 불구하고 무응답이 생길 때, 그 무응답을 ‘통계이론적으로 어떻게 처리하는 것이 바람직한가’를 생각해야겠죠. 통계학자들은 이런 무응답이 생겼을 때 어떻게 처리하는 것이 바람직한가를 연구합니다.

 

Q 그렇다면 무응답은 어떻게 처리하는 것이 좋을까요?

 

무응답을 처리하는 것은 크게 그 사람이 전부를 거절했을 때, 그런 무응답을 ‘단위 무응답’이라고 하는데 단위 무응답일 때는 가중치를 새로 조정해서 가중치 조정이라는 방법을 쓰고. 그 다음에 어떤 사람이 무응답을 했는데 설문지를 다하지 않고 몇 개를 빠트렸다면 ‘항목 무응답’이라고 해요. 항목 무응답일 경우에는 대체를 통해서 무응답을 처리합니다. 이러한 통계학적 방법들이 있습니다. 

 

Q 교수님 논문 중에 ‘패널조사의 특성과 문제점’이라는 것이 있는데, 패널조사란 무엇인가요?

 

매번 조사할 때마다 조사대상이 바뀌는 것은 일반조사인데. 패널조사는 조사할 때마다 똑같은 사람을 추적해서 조사하는 것입니다. 그러니까 똑같은 사람의 생각이 어떻게 변하는가를 보려고 하는 것이죠. 그런데 패널조사를 하는 경우 비용이 많이 들어요. 왜냐하면 그 사람을 다음에도 또 찾아가야하는데 그 사람이 없을 수도 있고 이사갔을 수도 있으니까 추적하는데 비용이 많이 들어요. 그래서 패널조사일 때는 관리를 잘해야 합니다.

 

Q 일반 국민들이 통계를 알아야하는 이유를 교수님의 입장에서 얘기를 한다면?

 

쉽게 얘기한다면 대학교를 진학할 때 내 점수로 어느 대학을 갈 수 있을지, 정보가 필요하잖아요. 그 정보가 통계에요. 그 정보가 있으면 보다 합리적인 결정을 할 수 있을 것입니다. 우리 현대사회가 굉장히 복잡하니까 판단을 해야 하고 의사결정을 내릴 때 보다 합리적인 기준을 가지고, 근거에 의해서 의사결정을 내리려고 할 때 합리적인 기준, 근거가 바로 통계가 되는 것이죠. 그래서 예를들어 정부에서 주택정책을 쓰고 싶다. 그렇다면 집을 어디에 더 지어야 하는가. 인구가 늘어나는 지역에 집을 더 지어야 되겠죠. 그런데 인구가 줄어드는 곳에, 수요가 없는 곳에 집을 지으면 미분양사태가 일어나겠죠. 이 지역에 주택수요가 얼마냐. 주택수요에 대한 예측은 통계를 통해서 하는 것입니다. 용인에서 경전철을 만들었는데, 실패한 정책의 대표적인 사례잖아요. 수요예측을 잘못해서 돈은 많이 투입했는데, 적자가 나서 개통도 못하고 그랬었죠. 이런 것을 통해 통계의 중요성을 알 수 있습니다.

 

Q 마지막으로 하실 말이 있으시다면?

 

우리나라 학생들은 통계가 어렵다는 생각을 하고 통계에 대해서 거리감을 느끼곤 합니다. 그런데 사실은 통계는 굉장히 유용하고 도움이 많이 되기 때문에 통계청에서 국민들이 통계를 어려워하지 않고 흥미를 가지고 쉽게 접근할 수 있도록 노력을 해주면 좋을 것 같습니다.


※ 본 글은 '통계청블로그기자단'의 기사로 통계청의 공식입장과 관계가 없습니다.

신고
트랙백 TRACKBACK :0 개, 댓글 COMMENT :0 개가 달렸습니다.
[##_http://hikostat.kr/owner/entry/1L%7Ccfile4.uf@243AD333514C2C0216794D.jpg%7Cwidth=%22379%22%20height=%2295%22%20alt=%22%EC%82%AC%EC%9A%A9%EC%9E%90%20%EC%82%BD%EC%9E%85%20%EC%9D%B4%EB%AF%B8%EC%A7%80%22%7C_##]














…미국 대선이 석 달 앞으로 다가온 가운데 최근 상승세였던 존 매케인 공화당 대선 후보가 지지율에서 버락 오바마 민주당 후보에 5%p차로 역전한 것으로 나타났다. 로이터와 조그비가 지난 14일부터 16일까지 미국 내 1천 89명의 유권자들을 대상으로 실시한 전화여론조사에 따르면 매케인이 46%를 기록해 41%에 그친 오바마에 앞섰다.( 95% 신뢰수준에 오차범위는 ±3%p) 로이터-조그비가 매달 실시중인 대선 후보 지지도 조사에서 매케인이 오바마를 앞지른 것은 이번이 처음으로 지난 7월 조사에서는 오바마가 7%p 차이로 앞선바가 있다. …   프리존뉴스(2008.8.21)


사용자 삽입 이미지















우리나라도 대선이나 국회의원 선거철이면 이런 종류의 여론조사 기사를 많이 접하셨을 겁니다. 하지만 조사 결과와 선거 결과가 항상 같은 것은 아니지요. 그럼 우리는 여론조사에 나온 숫자를 어떻게 해석해야 할까요?


 여론조사에 대한 기사를 읽을 때면 매번 보는 용어가 있을 것입니다. 바로 신뢰수준과 오차범위지요. 여러분은 이 용어의 뜻을 아시나요?


 오차범위 ±3%p라는 의미는 표본을 뽑아서 조사된 지지율이 10%이라면 전체 유권자를 대상으로 조사한 지지율은 오차범위 7%~13% 사이에 있을 수 있다라는 뜻 입니다.   신뢰수준 95%라는 것은 똑같은 조사를 100번하면 95번 정도는 오차범위 내에 전체 유권자의 지지율이  있을 것이고 5번은 아닐 수 있다는 말입니다.


 앞의 기사로 돌아가 봅시다. 로이터-조그비의 조사를 똑같이 반복했을 때 오차범위가 ±3%p이라 했으므로 전체 유권자를 대상으로 조사한 지지율을 예측하면, 매케인 지지율 범위가 43~49%, 오바마 지지율 범위 38~44%에 있을 가능성이 95%라고 해석할 수 있습니다. 이것은 실제 결과로는 매케인이 43%, 오바마가 44%일 수도 있다는 말이지요.


 즉, 기사에서는 매케인이 46%로 41%인 오바마를 앞섰다고 했지만 표본 1천여 명이 아닌 유권자 전체를 실제 조사했을 때는 그 결과가 어떻게 될지 알 수 없다는 것입니다.


 종종 기사에서 ‘두 후보가 오차범위 내에서 접전 중’이라는 표현을 본적이 있으실 것입니다. 바로 위의 매케인과 오바마 같은 경우를 말하는 것이지요. 여러분, 기사에 나온 지지율을 그대로 받아들일 것이 아니라, 신뢰구간과 오차범위를 함께 잘 파악해두는 지혜가 필요하겠죠?



신고
트랙백 TRACKBACK :0 개, 댓글 COMMENT :0 개가 달렸습니다.

티스토리 툴바