人文,社會科學/時事·常識

[이야기 책세상] 빅데이터 "세종은 이미 600년 전 활용했다"

바람아님 2017. 12. 29. 09:39

매일경제 2017.12.28. 17:08

 

쌓인 정보를 더 빠른 속도로 분석하는 기술이 계속 발전하면서 빅데이터가 갈수록 주목받고 있다. 컴퓨터 전문업체 IBM에 따르면 빅데이터는 규모(Volume), 다양성(Variety), 속도(Velocity), 진실성(Veracity)이라는 네 가지 브이(V)로 요약할 수 있다. 그런데 위의 네 가지 기준에는 각각 염두에 두어야 할 점이 있다.


첫째, 데이터의 규모에도 효율성이 필요하다. 전 세계적으로 2020년까지 43조 기가바이트의 데이터가 만들어질 것으로 예측된다. 2005년과 비교하면 300배가량 증가한 수치다. 하지만 쌓아놓는다고 능사는 아니다. 이런 데이터 규모에 걸맞은 정리와 제거는 필수항목이다.

쓸모없는 데이터를 골라내는 데도 시간이 적지 않게 든다. / Unsplash


둘째, 데이터 형식에도 어느 정도 보편성은 필요하다. 단순 텍스트를 벗어나 각기 다른 형식의 데이터들이 쌓이고 있다. 서비스 주체에 따라 형식도 다르다. 그러나 누구나 손쉽게 접근이 가능한 정보가 되려면 데이터 형식이 일반적이어야 한다.


셋째, 놀라운 확산 속도에 맞는 보안이 필요하다. 지금은 전 세계 인구 70억 명이 평균 2.5개의 네트워크 연결을 갖고 있는 초연결사회다. 국가와 기업, 개인의 중요 데이터가 새어나갈 경우 부작용은 극심해진다. 사이버 보안은 앞으로 반복해서 등장하는 뉴스가 될 것이다.


넷째, 데이터의 진실성이 점점 더 중요해진다. 미국 경제에서는 질이 떨어지는 데이터로 인해 연간 3.1조 달러에 달하는 비용이 낭비된다고 한다. 제아무리 분석하고 관리해도 거짓 데이터로는 완벽한 추론이 어렵다.

빅데이터 활용에 있어 이 네 가지 기준을 모두 준수하기란 쉽지 않다. 하지만 600년 전쯤 이 일을 해낸 왕이 있다. 바로 조선의 세종이다. 세종은 토지 1결당 10두의 세금을 정한 공법을 시행했다. 개별 토지 수확량을 확인해 납부액을 결정하던 과전법의 보완책으로 나온 법이다.

세종은 빅데이터 활용의 좋은 예를 보여줬다. / Pixabay

이 과정에서 세종은 전국 백성의 의견을 취합하고 데이터를 모았다. 1430년 3월부터 5개월간 전국에 걸쳐 찬반 의견을 모았다. 17만 명의 의견을 받고도 부족하다고 느낀 세종은 계속해서 백성들의 의견을 받아 법을 보완했다. 13년이 지나서야 공법은 시행될 수 있었다.


세종은 방대한 양의 데이터를 모아 필요한 것을 고르고, 글과 음성 등 다양한 형식의 데이터가 하나의 주제로 사용될 수 있도록 정리했다. 또 전혀 다른 목적으로 데이터가 쓰이지 않도록 보안을 유지했다. 위정자의 입맛에 따라 데이터가 조작될까 우려해 끝까지 진실성 여부를 확인했다. 백성의 의견을 모은 후 법 시행까지 13년이 더 걸렸다는 사실은 당시가 왕조 시대였음을 무색하게 한다.


[MK스타일 김석일 기자 / 도움말 : 고평석 (‘제4의 물결, 답은 역사에 있다’ 저자)]