hot topic

 


메르스 공포에 휩싸여 있던 지난 여름을 기억하시나요? 전국 곳곳에서는 메르스 환자가 발생하고 있었고, 사람들은 언제 주변에서 메르스에 옮지는 않을지 걱정하고 있었습니다. 하지만 몇몇 사람들은 지금이야말로 학문을 실생활에 적용할 수 있는 시기라며 의욕을 불태웠습니다. 그 사람들은 바로 빅데이터 분야 종사자들이었습니다. 여러 빅데이터 전문과들과 페이스북 친구를 맺고 있던 저는 그분들이 메르스 관련 데이터로 사람들에게 어떻게 도움을 줄 수 있을지 고민하는 모습을 보았습니다. 



빅데이터 전문가들에게 메르스 사태는 학문을 실생활에 적용할 기회로 여겨졌습니다 



이런 모습에 이제는 사람들이 데이터를 주고 받는 수준을 넘어, 주어진 데이터를 재가공하고 다시 사람들에게 전파하는 시대에 들어섰다는 것을 느꼈습니다. 그리고 이를 한 단어로 표현한 것이 바로 ‘데이터 저널리즘’입니다. 데이터(Data)와 저널리즘(journalism)이 결합된 단어인 데이터 저널리즘, 이 생소한 용어가 이번 기사의 주제입니다. 통계와 빅데이터에 관심을 갖고, 사방의 데이터를 가공해 자신의 이야기를 만들어가고 싶은 분이라면 이번 기사를 통해 새로운 지식을 알아갈 수 있을 것입니다. 


데이터 저널리즘이란?


저널리즘이란 매스미디어를 활용하여 공공적인 사실이나 사건에 관한 정보를 보도하고 논평하는 활동(매일경제 출처)입니다. 그렇다면 데이터 저널리즘이란, 데이터를 통해 사실이나 사건을 보도하는 활동이라 할 수 있겠죠? 풀어 말한다면, 데이터 저널리즘이란 데이터를 깊이 파내어 모으고, 정제하고, 구축하고, 솎아 내어 보기 좋은 이야기로 만드는 일련의 작업 과정입니다. 위에서 말씀드렸던 메르스 사태를 통해 이를 자세히 들여다보도록 하겠습니다

KBS의 데이터 저널리즘 팀은 메르스 발생 현황을 각종 오픈 데이터와 결합해 제공하고 있습니다.
(http://dj.kbs.co.kr/resources/2015-06-04/
 

KBS는 메르스로 한창 떠들썩했던 6월 초, 각종 통계자료를 기반으로 한눈에 파악하기 쉽도록 데이터를 시각화하여 공개했습니다. 각 사람들의 감염 실태, 구글 지도를 기반으로 한 감염자 이동경로 등, 통계치로만 주어졌을 때 알기 힘든 정보를 여러 방식으로 보여주었습니다.

 

이러한 작업은 쉽게 보이지만, 사실 상당히 복잡한 과정이 요구됩니다. 우선 데이터를 확보해야 합니다. 정부에서 발표하는 데이터 외에 인터넷에 떠돌고 있는 오픈데이터까지도 추출하여 통계화할 수 있어야 합니다. 지금은 인터넷을 통해 누구든 데이터를 올릴 수 있는 시대이며, 데이터 저널리즘은 이러한 양방향 소통을 특징으로 갖고 있습니다. 다음으로는 공공 데이터를 디자이너와 프로그래머가 협력해 결과물을 만들 수 있어야 합니다. 위 KBS의 데이터 저널리즘은 오픈데이터를 토대로 디자이너와 프로그래머가 합작해 새로운 결과물을 만들어낸 것입니다. 디자이너는 어떻게 하면 사람들이 직관적으로 이해할 수 있을지 고민하며, 프로그래머는 데이터를 수집하고, 디자이너의 생각에 맞게 데이터를 표현합니다. 이를 통해 독자는 더 복잡한 통계수치 없이 현상을 이해할 수 있습니다.




이제는 누구나 데이터를 활용할 수 있는 시대가 되었습니다. 
하지만 Java와 같은 프로그래밍을 이해하지 못하고는 데이터를 활용하기란 쉽지 않은 일입니다. 


이것이 기존의 저널리즘과 다른 점은 무엇일까요? 기존에도 많은 보도자료는 통계청 자료처럼 여러 통계자료를 근거로 글을 썼습니다. 하지만 숫자나 단순한 그래프로 제공되는 것과 이를 지도나 데이터와 관련된 시각자료와 통합하여 보여주는 것은 다릅니다. 특히, 데이터 저널리즘의 특징은 데이터를 스토리화하여 보여준다는 점입니다. 단순한 통계자료를 넘어 데이터의 스토리를 보여주는 것이 데이터 저널리즘의 핵심입니다. 

또한 데이터 저널리즘은 기술적인 영역이 혼합된 분야입니다. 데이터를 스토리화한다는 점은 곧 데이터마다 다른 스토리를 가진다는 말입니다. KBS에서 만든 메르스의 데이터 저널리즘은 전염병이 아닌 다른 스토리에서는 활용하기 어렵습니다. 게다가 신종플루와 같이 많은 사람들에게 걸리는 질병에도 활용할 수가 없습니다. 결국 매 데이터마다 새로운 디자인과 개발이 필요하게 됩니다. 따라서 데이터 저널리즘이란 통계학, 디자인, 프로그래밍, 마지막으로 이를 스토리화할 수 있는 통찰력이 융합된 종합 학문의 영역이라 할 수 있습니다.

 

데이터 저널리즘의 역사

 

데이터 저널리즘의 역사는, 용어가 2010년부터 쓰인 것에 비해 상당히 오래되었습니다. 가장 유명한 데이터 저널리즘의 예는 나이팅게일의 보고서입니다. 나이팅게일은 1854년 크림전쟁 당시 위생 상태에 의해 사망하는 사람이 많다는 점을 알아냈고, 이를 설득하기 위해 여러 시각자료를 활용하였습니다. 위생을 개선하여 42%의 사망률을 2%까지 줄일 수 있다는 점을 장미 모양의 도표로 표현하였고, 800장의 복잡한 보고서를 단순한 시각자료로 축약해 보여줄 수 있었습니다. 19세기 최고의 통계그래픽으로 손꼽히는 이 그래프는 데이터 저널리즘의 효시가 되었습니다. 이후 많은 세계의 많은 언론은 통계의 시각적 표현에 큰 관심을 보여왔고, 뉴욕 타임즈와 가디언 지는 데이터 저널리즘 팀을 운영하며 각종 이슈를 시각화하여 보여주고 있습니다.


나이팅 게일의 통계 그래프. 왼쪽 데이터는 개선 이후, 오른쪽 데이터는 개선 이전의 것입니다. 
각 달별 사망 원인을 그래프화하여 보여주며 통계 그래프 역사의 한 획을 그었습니다. (출처: Wiki백과) 


그렇다면 우리나라는 어떨까요? 우리나라 최초의 데이터 저널리즘은 제민일보의 4.3사건 보도로 알려져 있습니다. 아직 컴퓨터가 보급되기 전 1990년대 초 제민일보는 4.3사건의 증거자료를 데이터베이스화 하여 대량의 데이터를 저장하고 분석해 4.3특별법까지 제정시키며 데이터 저널리즘의 힘을 보여주었습니다. 이후 많은 언론들이 데이터의 중요성을 깨달았고, 자신들만의 데이터베이스를 구축해나갔습니다.

최근에는 메이저 언론사와 지역 언론사들도 데이터 저널리즘에 관심을 보이고 있고, 다양한 보도를 해오고 있습니다. 부산일보는 작년 지역 언론사 최초로 ‘석면 쇼크, 부산이 아프다’라는 제목으로 데이터 저널리즘을 보여주었습니다. 부산일보는 30여년간 지속된 환경질환의 실태를 누적 데이터와 인터뷰로 집대성해 보여주고 있습니다. 석면에 관한 모든 컨텐츠를 웹에 갖추어 놈으로서 독자는 자신의 동네 현황을 확인함은 물론 다양한 컨텐츠를 마치 잡지를 읽듯 흥미롭게 살펴볼 수 있습니다.


(http://shock.busan.com)


부산일보의 '석면 쇼크, 부산이 아프다' 보도는 지난 30년간 석면이 우리에게 

어떤 영향을 끼쳤는지 다양한 자료를 통해 보여주고 있습니다.


 

단순히 보고 듣고 느끼는 정도를 넘어, 독자가 자신의 데이터를 입력하며 실제 자신의 이야기처럼 느낄 수 있도록 만든 이 보도는 두 달간의 노력의 산물이라고 합니다. 부경대학교 IT융합응용공학과 송하주 교수팀과 협업해 만들어진 이 컨텐츠는, 이제는 언론 보도가 단순한 텍스트와 수치의 나열에서 벗어나고 있다는 것을 보여주고 있습니다.

 

 

 인터뷰 : 국내 데이터 저널리즘의 현재와 미래

 

 

지금까지 데이터 저널리즘의 역사를 알아봤다면, 이번에는 국내 데이터 저널리즘의 현황과 그 한계는 무엇일지, 그리고 어떤 방향으로 나아가는 것이 좋을지 살펴보도록 하겠습니다. 이 부분은 국내 데이터 저널리즘 분야의 권위자이신 신동희 성균관대 인터렉션사이언스학과 교수님의 도움을 받았습니다. UI/UX 분야와 인간-컴퓨터 상호작용을 연구하시는 교수님께서는 최근 빅데이터가 언론 영역에 접목된 데이터 저널리즘과 컴퓨테이셔널 저널리즘까지 연구를 확장하며 많은 글과 기사를 작성하고 계십니다. 그럼 교수님과 함께 데이터 저널리즘에 대해 더 깊게 들어가볼까요?


1. 안녕하세요 신동희 교수님, 교수님께서 데이터 저널리즘에 관심을 갖게 된 배경이 있나요? 

데이터 저널리즘을 처음 알게 된 것은 빅데이터가 관심을 받기 시작한 시기와 일

치합니다. 빅데이터의 중요성이 높아지며 의료, 과학, 경영, 문화의 분야에 적용이 되는데, 언론분야에는 어떻게 응용이 되는지 궁금해 하면서 데이터 저널리즘에 관심을 가지게 되었습니다. 저널리즘적 가치를 추구하는 언론과 데이터로부터 가치를 추출하고 분석하는 빅데이터가 융합되는 데이터 저널리즘은 분명 흥미로운 주제였습니다.


2. 최근 국내에서도 데이터 저널리즘 교육이 진행되는 등 데이터 저널리즘이 뜨고 있습니다. 최근 국내의 데이터 저널리즘에 대해 어떻게 생각하시나요?

국내에선 데이터 저널리즘을 강화해야 한다는 여러 지적에도 불구하고 언론사들 사이에서는 데이터 저널리즘을 텍스트 기사 작성을 기반으로 하는 전통 저널리즘 행위의 보조 수단으로 인식하는 경향이 많이 존재했습니다. 여전히 한국의 저널리즘은 자사가 가지고 있는 기사 자료에 이미지 혹은 플래시 등의 그래픽 정보를 연결하는 초보 수준에 머물고 있는 경우가 많습니다. 뿐만 아니라 제한적인 데이터의 사용, 다양성이 결여된 퍼블리싱(publishing) 형태, 사용자들의 참여와 소통의 부재 등은 국내 데이터 저널리즘의 현재 수준을 가늠하게 해 주고 있습니다. 최근 인포그래픽을 강화하려는 언론사들이 늘고는 있지만, 저널리즘 성격보다는 디자인과 소프트웨어에 중점을 두는 경향을 보이고 있습니다. 이렇게 될 수밖에 없는 데에는 데이터의 중요성에 대한 인식의 부재도 있지만 정부와 언론사 자체의 구조적인 문제가 존재하고 있기 때문입니다.

 


3. 데이터 저널리즘에 대해 알아가다 보니 데이터 시각화와 분명한 구분이 쉽지 않은데, 데이터 시각화와 데이터 저널리즘의 차이는 무엇일까요?

 

국내 언론사는 데이터 저널리즘을 데이터의 시각화로만 인식하는 것이 한계입니다. 즉, 데이터 저널리즘을 데이터에 대한 창의적이고 유연한 소프트웨어로 보는 접근이 아닌, 시스템과 기술적 문제의 하드웨어로 보는 경향에 매몰되어 있는 것입니다. 데이터 저널리즘은 단순한 기술의 적용 문제를 넘어 인식과 철학의 범주가 보다 결정적인 부분입니다. 아직 데이터를 다루는 부서나 종사자는 뉴스 룸 안에서 주변부에 불과해 역량과 명성을 가진 기자나 전문가들과는 거리가 먼 부서로 인식되고 있습니다. 뉴스 룸의 의사결정자들이 대부분 구세대로 디지털의 숙련도가 떨어지고, 그 중요성을 제대로 인식하지 못하는 점이 문제입니다. 대부분의 뉴스 룸이 데이터를 왜 최적화해야 하는지, 그리고 그것이 궁극적으로 어떻게 다뤄져야 하는지에 대해 이해하지 못하고 있습니다.


4. 국내 데이터 저널리즘의 미래가 어떻게 될 것이라 보시나요?

데이터 저널리즘이 미국과 유럽에서 유래한 모델인데, 과연 국내의 상황에 맞는 한국적 모델로서의 데이터 저널리즘이 도출되어 안정적으로 적용될 수 있을지가 관건입니다. 최근의 스마트 정부(smart government)’ 또는 ‘정부 3.0(government 3.0)’ 등의 정책은 데이터 저널리즘의 활로를 개척할 수 있는 기반이 되고 있습니다. 정부가 보유하고 있는 공공 데이터의 과감한 공개를 통해 국민 개개인의 요구를 찾아낼 수 있는 모델을 개발하고, 이것을 바탕으로 국민이 요구하기 전에 먼저 개인화한 정부 서비스를 제공하는 것이 핵심입니다.

데이터 저널리즘의 비전은 언론이 지난 수백 년간 쌓아온 고유의 문화가 데이터베이스의 활성화라는 기술적 변화상과 어떤 형태의 조화를 이뤄 내느냐에 달려 있습니다. 비록 그 모습을 단정적으로 예측하는 것은 어렵겠지만, 결국 저널리스트들의 전문가적 윤리의식이 그 핵심에 있을 것임을 기대하는 것은 어렵지 않습니다. 즉, 아무리 기술과 시스템, 데이터베이스가 발전하더라도 그 기술적 가공물을 다루고 최종적 판단을 하는 것은 바로 인간의 판단이라는 고전적 진리가 데이터 저널리즘에도 적용될 것입니다. 

 

빅데이터 시대, 그리고 데이터 저널리즘


이 기사는 빅데이터 주제로 잡은 세번째 기사입니다. 
데이터 사이언티스트(http://me2.do/GNA3R88B), R 프로그래밍(http://me2.do/FMUHTRq7)에 관한 기사를 쓰고, 대학원에서 인턴으로1년 넘게 공부하며 깨달은 점 중 하나는 빅데이터란 인문학과 공학의 접점에 있다는 점입니다. 데이터 저널리즘은 그러한 흐름의 중심에 위치하고 있었기에, 저는 이를 빅데이터의 세번째 기사로 쓰기로 결심했습니다.

 

빅데이터 시대가 가져다준 것 중 가장 확실한건, 데이터가 축적될 요건이 마련됐다는 점입니다. 사람들은 이 데이터를 어떻게 쓸지 고민했고, 언론은 보도에 데이터를 활용할 방법을 고민하기 시작했습니다. 각 언론사에는 데이터 저널리즘 팀이 만들어졌고, 뉴스젤리는 최근 데이터 저널리즘을 주제로 강의를 진행하고 있습니다. 

그럼에도 아직은 데이터 저널리즘이 대중에게 익숙한 용어가 아니며, 언론에 정보기술을 활용한다는 점도 낯선 이야기입니다. 인문학과 공학이라는 두 문화는 여전히 다른 세상의 이야기로만 받아들여지는 듯합니다.

지금의 시대는 흔히 융합의 시대라고 말합니다. 초등학생이 프로그래밍을 배우고 있고 공대생이 한국사를 배우고 디자인을 배우는 시대가 되었습니다. 데이터 저널리즘은 이러한 시대를 반영하고 있습니다. '글'이 '통계'와 '컴퓨터'를 만났을 때 어떤 효과가 발생할 수 있는지를 데이터 저널리즘은 보여주고 있습니다. 지금의 시대가 필요로 하는 것은 이처럼 인문학과 공학이라는 두 문화 사이의 구분보다는 두 문화가 융합된 하나의 문화일 것이며, 타 분야에 대한 열린 태도는 데이터 저널리즘은 물론 다양한 신 학문이 발달하는 토양이 될 것입니다.




   글은 '통계청블로그기자단' 기사로 통계청의 공식입장과 관계가 없습니다. 



 

신고
트랙백 TRACKBACK :0 개, 댓글 COMMENT :0 개가 달렸습니다.

티스토리 툴바