매일경제 2017.12.28. 17:08
쌓인 정보를 더 빠른 속도로 분석하는 기술이 계속 발전하면서 빅데이터가 갈수록 주목받고 있다. 컴퓨터 전문업체 IBM에 따르면 빅데이터는 규모(Volume), 다양성(Variety), 속도(Velocity), 진실성(Veracity)이라는 네 가지 브이(V)로 요약할 수 있다. 그런데 위의 네 가지 기준에는 각각 염두에 두어야 할 점이 있다.
첫째, 데이터의 규모에도 효율성이 필요하다. 전 세계적으로 2020년까지 43조 기가바이트의 데이터가 만들어질 것으로 예측된다. 2005년과 비교하면 300배가량 증가한 수치다. 하지만 쌓아놓는다고 능사는 아니다. 이런 데이터 규모에 걸맞은 정리와 제거는 필수항목이다.
둘째, 데이터 형식에도 어느 정도 보편성은 필요하다. 단순 텍스트를 벗어나 각기 다른 형식의 데이터들이 쌓이고 있다. 서비스 주체에 따라 형식도 다르다. 그러나 누구나 손쉽게 접근이 가능한 정보가 되려면 데이터 형식이 일반적이어야 한다.
셋째, 놀라운 확산 속도에 맞는 보안이 필요하다. 지금은 전 세계 인구 70억 명이 평균 2.5개의 네트워크 연결을 갖고 있는 초연결사회다. 국가와 기업, 개인의 중요 데이터가 새어나갈 경우 부작용은 극심해진다. 사이버 보안은 앞으로 반복해서 등장하는 뉴스가 될 것이다.
넷째, 데이터의 진실성이 점점 더 중요해진다. 미국 경제에서는 질이 떨어지는 데이터로 인해 연간 3.1조 달러에 달하는 비용이 낭비된다고 한다. 제아무리 분석하고 관리해도 거짓 데이터로는 완벽한 추론이 어렵다.
빅데이터 활용에 있어 이 네 가지 기준을 모두 준수하기란 쉽지 않다. 하지만 600년 전쯤 이 일을 해낸 왕이 있다. 바로 조선의 세종이다. 세종은 토지 1결당 10두의 세금을 정한 공법을 시행했다. 개별 토지 수확량을 확인해 납부액을 결정하던 과전법의 보완책으로 나온 법이다.
이 과정에서 세종은 전국 백성의 의견을 취합하고 데이터를 모았다. 1430년 3월부터 5개월간 전국에 걸쳐 찬반 의견을 모았다. 17만 명의 의견을 받고도 부족하다고 느낀 세종은 계속해서 백성들의 의견을 받아 법을 보완했다. 13년이 지나서야 공법은 시행될 수 있었다.
세종은 방대한 양의 데이터를 모아 필요한 것을 고르고, 글과 음성 등 다양한 형식의 데이터가 하나의 주제로 사용될 수 있도록 정리했다. 또 전혀 다른 목적으로 데이터가 쓰이지 않도록 보안을 유지했다. 위정자의 입맛에 따라 데이터가 조작될까 우려해 끝까지 진실성 여부를 확인했다. 백성의 의견을 모은 후 법 시행까지 13년이 더 걸렸다는 사실은 당시가 왕조 시대였음을 무색하게 한다.
[MK스타일 김석일 기자 / 도움말 : 고평석 (‘제4의 물결, 답은 역사에 있다’ 저자)]
'人文,社會科學 > 時事·常識' 카테고리의 다른 글
[조용헌 살롱] [1124] 後天開闢의 역사철학 (0) | 2018.01.02 |
---|---|
새해 여는 종소리, 보신각종 만든 사람은 누구? (0) | 2017.12.31 |
[윤희영의 News English] 서로의 눈과 팔이 돼 준 두 장애인 (0) | 2017.12.26 |
[나리카와 아야의 서울산책] 질서 잘 지키고 친절한 일본? 한국처럼 지역 따라 달라요 (0) | 2017.12.24 |
[퇴근길 잡학사전]크리스마스는 원래 봄?..겨울로 옮겨진 성탄절의 사연은? (0) | 2017.12.22 |