데이터시각화는 데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하는 과정을 말한다.
데이터시각화를 잘못 표시하거나 해석하게 되면 크게는 사회적인 문제까지 영향을 미칠 수 있어 올바르게 사용하는 것이 매우 중요하다.
데이터시각화의 사례와 디지털 플랫폼정부에 대해 함께 알아보자.
데이터시각화 예시: 산업위기 조기 경보(Early Warning)
일반적으로 신용평가 모형은 상대적으로 1년 이상의 장기간에 대한 신용도(Probability of Default)를 평가하는데 특화되어 있다.
반면 조기경보 모형(Early Warning)은 비교적 갱신주기가 짧은 단기성 정보를 이용하여 적시성 있게 신용도를 평가하며, 기업 부실화를 빨리 인지하는 것에 특화되어 있고,
재무정보, 금융거래 정보, 휴폐업 정보, 연체정보 등을 활용하며, 정상, 관심, 관찰, 휴업, 부도, 폐업 등급으로 구성되어 있다.
개별적인 기업의 EW정보를 이용하여 산업별/지역별 EW 가중치를 활용해 EW Index를 산출 후 산업위기 모니터링에 적용하여 보았으며 아래와 같이 조기에 지역단위,
산업단위의 위험을 발견할 수 있었다.
EW Index 사후 검증 작업 수행을 위해, “산업위기 특별대응지역”을 대상으로 적합성 및 유효성 검증작업을 진행했다.
울산 동구 지역의 조선업은 2018년 6월에 산업위기 지역으로 선정되었으며, EW Index 는 2016년 8월에 절대적 위험 수준의 임계값을 저촉했다.
산업위기 지역으로 선정되기 약 2년 전에 그 위험을 사전적으로 캐치해 실제 업무에서의 유효성을 입증한 것이다.
“산업위기 특별대응지역”지정 현황 및 EW Index 유효성 검증
산업위기대응 특별지역이 확정되면 막대한 경제적, 사회적 사후 처리 비용이 발생하므로, 위의 EW Index를 활용하여 선제 대응할 수 있다.
울산 지역의 기업 휴폐업/부도 현황 (좌:2017년도 vs 우: 2019년도)
위 그림은 데이터를 시각화하여 지도위에 기업의 현황을 보여주는 시각화 맵이다.
오른편에 있는 2019년도의 검은색과 빨간색의 노드는 기업의 휴폐업과 부도를 표시한 것으로 이런 데이터 시각화를 통해 울산의 산업의 위기를 보여주고 있다.
잘못된 데이터시각화 사례
잘못된 데이터 시각화는 이용자에게 잘못된 판단으로 이어질 수 있으며, 사회적인 문제까지 이어질 수 있다.
따라서 데이터 시각화와 데이터 리터러시는 모든 분야에서 중요한 역할을 하며, 이를 위해서는 사용자들이 데이터를 분석하고 이해하는 능력을 기를 필요가 있다.
2017년 4월 27일 도널드 J. 트럼프 대통령이 취임 100일을 맞이하여 로이터통신 기자들과 인터뷰를 했다.
중국과 시진핑 주석에 관해 한창 이야기하던 트럼프가 말을 멈추더니 기자에게 2016년 대통령 선거 지도를 나눠주며
“그거 가져가요. 최종 결과를 종합한 지도요. 보기 좋죠? 당연히 빨간색이 우리지.” 라고 말했다.
2017 REUTERS/Carlos Barria
하지만 이 지도는 각 후보자에게 투표한 ‘유권자’의 수를 나타냈다고 해석되기 때문에 잘못된 내용이다.
얼핏 봐도 대다수 미국 국민은 트럼프를 지지한 것처럼 지도가 온통 붉게 시각화 되어 있다.
하지만 실제로는 그렇지 않았다. 사실 이 지도는 ‘구역’을 표시한 것으로 정확하게 말하자면 ‘트럼프를 지지하는 카운티들’이라고 수정해야 한다.
지도에 표시된 색깔, 즉 붉은색(공화당)과 푸른색(민주당)의 비율을 추정해 보면 대략 80%의 붉은색과 20%의 푸른색으로 구성된 이 지도는
트럼프가 압도적인 표 차로 승리했다고 보이지만 트럼프는 대선에서 압승을 거두지 못했다.
미국은 각주의 선거인단 제도로 대부분의 주에서 승자독식제(Winner-take-it all) 방식으로 선거를 하게 되는데 선거인단 투표에서
트럼프 304표로 227표의 힐러리를 누르고 당선한 것이다.
Alberto Cairo(알베르토 카이로), ‘Visual Trumpery’
‘Visual trumpery’는 시각적으로 인상적인 그래픽이나 시각적 효과를 사용하여 사실과 다른 내용을 표현하거나, 편향적인 정보를 전달하려는 시도를 가리키는 용어로
시각적으로 인상적인 그래픽이나 시각적 효과를 사용하여 미묘하게 오해를 일으키거나 거짓 정보를 전달하려는 것을 의미한다.
"트럼프(Trump)"와 "trumpery" 사이에는 트럼프 대통령이 자주 거짓 정보를 전달하거나, 편향적인 정보를 사용하는 것으로 비판받았기 때문에, 이 용어가 생겨났다.
투표는 지역(면적)이 하는 것이 아닌데 투표 결과를 면적에 표시하면서 생긴 왜곡이고 오른쪽 그림은 이런 왜곡을 방지하기 위한 카토그램 지도 제작의 사례이다.
아래의 그림은 국내의 사례로 잘못된 시각화가 어떻게 의미를 잘못 전달하고 왜곡하고 있는지 확인할 수 있다.
국내 선거 당선결과 시각화 예시(출처:언론보도자료)
디지털 플랫폼정부
최근 디지털 시대의 도래로 인해 디지털 플랫폼은 사회와 경제 전반에 걸쳐 중요한 역할을 하고 있다.
정부에서도 디지털 플랫폼을 활용하여 효율적인 공공서비스 제공과 사회 문제 해결에 노력하고 있다.
모든 데이터가 연결되는 “디지털플랫폼” 위에서 국민, 기업, 정부가 함께 사회문제를 해결하고 새로운 가치를 창출하는 정부가 “디지털 플랫폼정부”의 핵심 모토이다.
디지털플랫폼정부 추진방향 (출처:디지털플랫폼정부 추진방향 강연)
디지털 플랫폼정부는 분절된 데이터의 공유와 융합을 통해 데이터와 서비스의 가치는 높이고,
부처 별로 분산된 시스템을 클라우드 상에 통합해 서비스의 중복을 제거하고 운영비용을 줄일 수 있다.
정부에서 공개한 데이터를 기반으로 민간에서 기업과 국민이 사회문제를 해결하고
디지털플랫폼정부 Kaggle(일명 DPG Kaggle:공모 및 경연을 통한 사회문제 해결) 시스템을 적극적으로 적용하여 운영하는 것도 좋은 방법으로 제안한다.
디지털 리터러시 역량이 증대된 디지털플랫폼 정부는 빅데이터를 활용한 근거 기반(Evidence Based)의 과학적인 정책 기반을 확보,
AI를 활용한 미래 예견적인 정책을 수립하며, 국민의 참여와 피드백을 수용하여 정책을 보완하고 발전시킬 수 있다.
이는 국민들의 삶과 사회를 더욱 발전시키는 데 큰 도움이 될 것이다.