“예측 가능하고 통제할 수 있는 위험은 더 이상 위험이 아니다.”
코로나19와 같은 예측이 불가능한 이벤트(외부충격)에 대해서는 적시에 산업/경제의 위험을 알려주는 ICT 데이터 기반의 빅데이터 플랫폼(Big Data Platform)이 필요하다.
그동안 많은 정부 정책 및 민간에서 활용하던 통계 및 실태조사에는 한계가 있었다.
예를 들면 1~2년 시차가 있는 통계지표를 활용한 정책을 수립하거나 광역통계만 있고 기초지자체(시·군·구 등) 통계의 부족으로 분석의 한계도 있었으며,
무엇보다도 가장 큰 문제는 각 위험지표를 모니터링 할 시스템(빅데이터 플랫폼)이 없다는 점이다.
위드 코로나 시대에 전반적인 산업 지원정책의 효과를 제고하기 위해 ICT 빅데이터를 활용한 근거 기반(Evidence Based)의 과학적인 정책기반 확보,
AI를 활용한 미래 예견적인 정책을 위한 빅데이터 플랫폼의 구축이 필요하다.
들어가기에 앞서...빅데이터 그리고 AI ?
들어가기에 앞서 최근 글로벌 기업의 빅데이터, AI의 인식변화와 사례를 중심으로 이야기를 해 보겠다.
최근 2021년 포춘(Fortune)에서 글로벌 기업 임원 대상 빅데이터 및 AI에 대한 인식 및 현황 조사한 결과, 주요 기업이 AI를 활용한 비즈니스 성과 달성에 상당한 진전이 있었다고
응답했다. 조사에 따르면 올해 96.0%의 임원들이 빅데이터와 AI의 노력이 성과를 내고 있다는 것을 인정했으며, 이는 불과 반년 전의 절반인 48.4%보다 증가한 수치이다.
필자는 2005년도부터 한국기업데이터(KED) 에서 빅데이터 플랫폼, 마이데이터, 빅데이터 전문가로 사업을 담당하고 있다.
누가 빅데이터가 무엇이냐고 물어보면 개인적으로 좋아하는 정의가 있다.
‘조직의 내/외부에 존재하는 다양한 형태의 데이터를 수집·처리·저장하여 목적에 맞게 분석함으로써 해당 분야의 필요지식을 추출하고 이를 조직의 전략적 의사결정에 활용하거나,
시스템화하여 상시적 운영시스템으로 활용하거나, 비즈니스 모델의 개발 및 개선에 활용하는 등의 제반 행위’를 포괄적으로 빅데이터라 정의하고 싶다.
개인적으로 ‘3V, 대용량 데이터=빅데이터’라는 설명은 좋아하지 않는다. 왜냐하면, 기술보다 중요한 것은 문제 해결을 위한 기획력(빅데이터 수집부터 AI까지)이기 때문이다.
조직에서 빅데이터, AI 도입에서 가장 중요한 빅데이터 성공의 방정식은 “어떤 문제를 해결하기 위해 ‘어떤 데이터’를 ‘어떻게 모아’ ‘어떤 방법(알고리즘)으로 분석·모델링하여’,
‘어떤 비즈니스 가치(Value)를 제공’ 하겠다”라는 기획력이다. 즉 빅데이터의 전산 기술보다는 실제적인 문제 해결을 위한 빅데이터 분석 기획 및 문제 해결을 위한 모델링이 가장 중요하다는 생각이다.
빅데이터, AI 활용사례: 기업 신용평가 모형
한 예로 금융권에서도 데이터 기반의 분석과 이에 기초한 비즈니스 인사이트 도출이 그 어느 때보다 중요하게 여겨지고 있으며, 머신러닝과 인공지능은 이러한 과정에 필수 불가결한 요소이다.
기업 신용평가모형에서도 1,000만 개 과거 정상/부도 기업정보 빅데이터를 토대로 기계학습을 시키고 나온 각 위험 요소별 가중치를 이용한 인공지능 기업 신용평가 모형을 개발했는데 인간의 자의적 판단의 평가성능보다 우수한 변별력을 보여주었다.
[그림] 빅데이터, 인공지능(AI)을 활용한 기업 신용평가모형 사례
빅데이터, AI 활용사례: EW (Early Warning) 등급 기반의 선제적 기업 부실 예측
일반적으로 신용평가 모형은 상대적으로 1년 이상의 장기간에 대한 신용도(PD, Probability of Default)를 평가하는데 특화되어 있지만,
조기경보 모형(Early Warning)은 비교적 갱신주기가 짧은 단기성 정보를 이용해 적시성 있게 신용도를 평가하며, 기업 부실화를 얼마나 빨리 인지하는 것에 특화되어 있다.
반면 조기경보모형은 재무·금융거래·휴폐업·연체·판매처/구매처·고용현황·실적 정보 등을 활용하며, 정상·관심·관찰, 휴업·부도·폐업 등급으로 구성되어있다.
[그림] 기업관련 ICT 빅데이터를 활용한 조기경보 모형 사례
개별적인 기업의 EW 정보를 이용하여 산업별/지역별 EW 가중치를 활용 EW Index를 산출하여 산업위기 모니터링에 적용하여 보았으며 아래와 같이 조기에 지역 단위, 산업 단위의 위험을 발견할 수 있었다.
EW Index 사후 검증작업 수행을 위해, “산업위기 특별대응지역”을 대상으로 적합성 및 유효성 검증작업을 진행하였으며,
울산 동구 지역의 조선업은 2018년 6월에 산업위기 지역으로 선정되었다. EW Index는 2016년 8월에 절대적 위험 수준의 임계값을 저촉하여 산업위기 지역으로 선정되기
약 2년 전에 그 위험을 사전적으로 캐치함으로써 실제 업무에서의 유효성을 입증하였다.
[그림] “산업위기 특별대응지역”지정 현황 및 EW Index 유효성 검증
산업위기대응 특별지역이 확정되면 막대한 경제적, 사회적 사후처리 비용이 발생하므로, 위의 EW index를 활용하여 선제 대응할 수 있다.
[그림] 울산 지역의 기업 휴폐업/부도 현황 (좌:2017년도 vs 우: 2019년도)
데이터를 시각화하여 지도위에 기업의 현황을 보여주는 시각화 맵이다. 오른편에 있는 2019년도의 검은색과 빨간색의 노드는 기업의 휴폐업과 부도를 표시하고 있다. 이런 데이터 시각화를 통해 울산의 산업의 위기를 보여주고 있다.
빅데이터 활용사례: 코로나 19 위기에 따른 산업위험파악
코로나19 확산으로 수요 감소 및 공급 축소 현상이 발생하고 있으며, 이에 따른 기업의 영업실적 부진 및 신용등급 하락이 심화하고 있다.
특히 단기부채 상환 및 연장에 대한 어려움 및 유동성 경색을 초래하고 있으며, 저금리 기조 아래 연명해온 한계기업들에 대한 흑자도산 가능성도 우려되고 있다.
다음은 기업의 코로나19 위기대응을 위한 빅데이터 분석을 통한 모니터링 방안이다.
[그림] 기업의 위기상황 파악을 위한 빅데이터 분석 사례
일반적으로 기업의 종업원 현황은 매출액과 정비례하는 관계를 나타내고 있으며, 해당 지표는 대규모 질병 감염 사태와 같은 외부충격에서 가장 선제적으로 모니터링해야 한다.
고용 빅데이터 분석결과 숙박/음식, 항공운송 산업은 대규모 질병 발생에 대한 영향도가 매우 높은 것으로 파악되고 있으며, 특히 항공운송의 경우 20년도 4월 퇴직자의 증가율이 매우 높게 나타나나 화물 수요에 따른 고용지표가 회복된 것을 볼 수 있다. 하지만 기업의 차입금(운전자금)이 매우 증가한 추세이다.
[그림] ‘항공운송’ 산업 고용현황 지표 및 차입금 증가율
빅데이터 활용 코로나19 재난지원금 효과 분석 사례
다음은 빅데이터 카드매출데이터 분석을 통해 재난지원금 효과에 대해서 분석해 보았다.
제주도의 경우 코로나19 발생 이후 급격한 매출 하락세가 유지되다가 제주형 재난소득 지급 및 정부 재난지원금 지급 이후 매출회복세를 보인다.
황금연휴와 맞물려 매출회복세 급등, 이후 8월 중순까지 전년도와 유사한 수준의 매출 유지, 9월 중순 이후 전년 매출 상회하고 있는 것이 보인다.
해외 빅데이터 시장과 거래 동향
미국 데이터 거래시장에서는 구글, 페이스북 등 초대형 IT 기업부터 스타트업 같은 소규모 벤처기업들이 연구개발 등에 필요한 데이터를 사고팔 정도로 거래가 활발하였다.
실제 IDC 조사 결과(2018)에 따르면 미국의 데이터 거래 규모는 1,500억 달러(180조 원)에 달했으며, 데이터 전문인력 규모는 1,401만 4,000명, 데이터 공급기업 수는
30만 2,810개, 데이터 중개상(Data Broker)은 2018년 기준 2,500 개 이상으로 전 세계 최대 규모에 달한다고 보고된 바 있다.
또한, 미국 데이터 시장에는 데이터를 수집·정제·분석하여 타 기관에 판매하는 데이터 브로커(Acxiom 등) 비즈니스도 활성화되어 있다.
중국의 데이터 거래시장은 정부 주도형 빅데이터거래소로 주로 독자적인 정부의 국영기업과 민영기업의 합작 형태로 운영되고 있다.
이러한 거래 모델의 특징은 첫째, 운영 방면에서 ‘국유지분·정부 주도 기업참여·시장운영’의 원칙과 둘째, 주주권 방면에서 ‘국유자산의 주주권 참여·관리계층의 주식보유·데이터 제공자의 주식참여’
등 혼합적인 소유제 모델을 갖고 있다는 것이다.
이를 통해 데이터의 권리를 보증하고 다양한 거래 주체의 적극성을 유도하여 참여 주체 범위를 확장하는데, 특히, 기존 ‘상업화’, ‘분산화’, ‘비규범화’의 데이터거래를
‘사회화’, ‘플랫폼화’, ‘규범화’하여 다양한 업종의 각 주체가 가진 분산된 데이터 자원을 통일된 플랫폼으로 통합하여 통일되고 규범화된 표준체계를 통해 다양한 지역과 업종의 데이터를
공유, 연결, 교환하고 있다.
중국 최대의 데이터거래소인 구이양 빅터이터거래소의 경우 현재 금융·정부·의료·사회·세관·에너지·사회·소비·공업·법원·교통·기업·통신·특허·교육·물류·경제·전자상거래·은행 등
30개의 거래 데이터 유형이 있으며 4,000여 개의 데이터 품목을 보유하고 있다.
빅데이터 플랫폼 사업이란?
4년 전 과기정통부로부터 우리나라에 맞는 빅데이터 유통거래소 모델에 대해 자문 요청을 받았다. 당시 중국의 정부 주도의 거래소 모델과 미국의 민간 데이터브로커 모델에 대한 벤치마킹 모델이
있었고, 과연 우리나라는 빠른 시간에 데이터 유통/결합 활성화를 위해 무슨 모델이 좋을지 갑론을박이 있었다.
한국형 데이터거래소는 공공지원의 민간주도 빅데이터 플랫폼(유통거래소)이 가장 좋겠다는 하이브리드 모델을 제안했으며 마중물 역할을 할 수 있는 데이터바우처 필요성에 대해서도 어필했다.
현재 과기정통부의 빅데이터 플랫폼 사업은 공공지원(NIA)의 민간주도 빅데이터 플랫폼 사업을 진행하고 있다.
NIA 빅데이터 플랫폼은 16개 분야별 데이터를 수집·가공하여 산업 전반에 필요한 양질의 데이터를 공급하는 역할을 하고 있으며 ‘빅데이터 플랫폼 사업’은 크게 ‘플랫폼’과 ‘센터’로 나누어져 있다.
‘센터’가 현장에서 데이터를 모아 ‘플랫폼’에 보내면 ‘플랫폼’은 해당 데이터를 취합하여 가공하거나 유통(판매)한다.
또한, 각 플랫폼에서는 데이터 분석 및 시각화 서비스 등 다양한 서비스를 경험할 수 있다.
[그림] 빅데이터 플랫폼 및 센터 개념도(출처: NIA)
디지털 산업혁신 빅데이터 플랫폼 필요성
전 세계 코로나19 확산에 따라 국제공급망(GVC) 재편, 산업 지형의 급변 등으로 불확실성이 커지는 가운데, 4차 산업혁명, 비대면 경제 활성화 등에 따라 산업 전반에
디지털 전환이 급격히 진행 중이다.
미국, 일본 등 세계 주요국들도 정보기술(IT) 기반 기업, 첨단 기술 등 자국이 보유한 강점에 산업 데이터와 ICT 디지털 기술을 융합하여 산업 경쟁력 강화를 추진 중이다.
이러한 국제 흐름 속에서 세계 최고의 기업도 디지털 전환에 기초하여 기존사업을 유연하게 변화하거나 새롭게 창출하지 못하면 빠르게 도태되므로 새로운 인사이트가 필요하다.
특히 기업들은 기술·인력·자금 등 역량 부족, 디지털 전환 효과에 대한 불확실성(벤치마킹 사례 부족), 산업 데이터 특수성(기업 영업비밀 등)을 고려한 법·제도 미비 등으로 인하여
산업 데이터 활용 및 디지털 혁신이 어렵다는 현장의 목소리가 크다.
이에 공공, 민간의 데이터 수요에 대응하고 데이터의 가치 활용성을 극대화하기 위한 빅데이터 플랫폼 구축이 필요했으며, 필자는 본 산업혁신 빅데이터 플랫폼 구축 사업에 참여하게 되었다.
산업 혁신 빅데이터 플랫폼
(https://bigdata-dx.kr)을 통해 산업혁신 플랫폼의 다양한 데이터 활용 및 시각화 서비스를 받을 수 있다.
[그림] 산업혁신 빅데이터 플랫폼 구성도
무엇보다도 디지털 전환이 조기에 뿌리내릴 수 있도록 공공᛫민간 중심의 산업 데이터 활용 시스템을 구축하여 민간의 데이터 유통과 결합을 촉진하고 사회현안 해결과 경제 활성화 효과가 높은 데이터 산업 육성이 목적이었다.
[그림] 빅데이터 플랫폼을 통한 데이터 융합/가공 예시
Global Value Chain 충격 및 공급망 디지털화 제시
코로나19 확산이 초래한 Global 공급망 충격은 공급 충격에서 수요충격으로 이어지고 있으며, 공급망(Supply Chain)의 위기로 전이되고 있고,
공급망 단절과 수요 감소의 악순환이 반복되고 있다. 빅데이터 분석을 통해 협력사 네트워크 실시간 가시성 확보, 공급망 전체 구조 파악 및 디지털화,
복원력과 대응성 중심의 공급망 재설계, 리쇼어링(국내 제조 역량 강화) 정책 이 필요하다.
예를 들면 국내 자동차 업체가 중국의 와이어 하네스 업체를 대상으로 주문 집중 발주했고, 코로나19에 따른 공급 문제 발생하자 국내 업체는 10일 정도의 조업 중단이 발생했었다.
이에 해외 공급자 빅데이터를 활용해서 대체 공급망에 대한 제시를 위해 베트남 자동차 부품 밸류체인을 디지털화 한 사례이다.
기업 부도는 대규모 질병 감염 사례와 같이 연쇄적인 부도로 연결된다. 특히, 중소기업의 부도 비율 중 약 37%는 거래처의 부실 또는 연쇄 부도가 사유이다.
중소기업의 거래 위험과 리스크 사전예방을 위해 기업의 구매처/판매처 빅데이터 분석을 통해 네트워크 분석을 한 사례이다.
[그림] A조선 부실에 따른 거래 네트워크 위험 전이 사례
ICT 빅데이터 기반 정책 지원 플랫폼 필요
위드코로나 시대 빅데이터 기반의 분석 및 모니터링은 여러 사회문제를 해결할 수 있고 AI 분석을 통해 많은 솔루션을 적시에 제공할 수 있다.
기업 및 공공 빅데이터를 활용하여 지역산업 현황 및 동향에 대한 체계적/실시간 파악할 수 있는 빅데이터 플랫폼을 통해 데이터에 근거한 과학적인 행정기반 확보 및
의사결정체제가 매우 중요하다.
또한, 개별 기업도 디지털 전환에 대한 이해도를 높이고 디지털 기반의 혁신을 통해 생산성과 효율성을 향상해야 한다.
산업혁신 개방형 빅데이터 플랫폼을 통해 데이터 유통과 결합을 통해 기업의 혁신성장을 가속화 하여야 한다.
정부와 지자체는 기업 관련 빅데이터 플랫폼을 이용하여 산업 위험도를 특정하여 산업위기에 대응하고, 데이터 기반의 사전예측을 통한 선제적 정책대응과 투자 효과 분석 등을
통해 지역 산업정책의 효과를 극대화한다. 기업 동향, 경기 동향, 생산 동향, 고용 동향, 혁신 동향의 5개 통계지표로 구성된 시범 빅데이터 플랫폼을
통해 기존의 사후적 대응 위주 정책에서 벗어나 예측을 기반으로 한 선제적 맞춤형 산업·경제정책 개발로 지원 효과를 빠르게 체감할 수 있을 것으로 기대한다.
정책지원을 통한 지역산업 빅데이터 분석 플랫폼 예시
기업체 현황
규모, 업종, 종사자규모, 업력 별 기업현황을 제공함으로써 전반적인 지역 산업 현황을 실시간으로 파악
신설법인 현황
지역별 신설법인 현황을 규모, 산업에 따라 시계열로 제공하며, 전년, 전국 신설법인 정보와 비교
특허 현황
규모, 업종, 종사자규모, 업력, 연도별, 월별 특허 및 실용신안 건수
고용 현황
규모, 업종, 시도, 시군구별로 종업원수 파악입사자/퇴사자/평균 급여 분석
[그림] 지역산업 빅데이터 분석 플랫폼 예시