人文,社會科學/科學과 未來,環境

[The New York Times] 인공지능 알파고가 인간을 절대 이길 수 없는 분야

바람아님 2016. 4. 25. 20:07

(출처: 중앙일보 2016.04.20 앤드루 매카피 MIT대 교수)


기사 이미지인공지능 알파고가 전 세계 바둑 챔피언인 이세돌을 4대 1로 이겼다. 
19년 전에도 우리는 인간과 컴퓨터의 대결에서 컴퓨터의 승리를 목격한 적이 있다. 
IBM의 컴퓨터 ‘딥블루’가 세계적인 체스 챔피언 가리 카스파로프를 누른 사건이다. 
운이나 우연이 끼어들 틈이 없는 바둑을 잘 두려면 대단히 복잡한 전략이 필요하다. 
대국자 2명이 가로와 세로 각각 19줄이 그어진 바둑판 위에 흑과 백의 돌을 번갈아 둔다. 
상대방의 돌에 포위된 돌은 판 밖으로 쫓겨난다. 
이렇게 쫓겨난 돌의 수와 상대방의 돌을 에워싸 확보한 집의 숫자가 많은 쪽이 이긴다.

체스와 달리 바둑은 최고수가 되는 비법을 말로 가르쳐줄 수 없다. 
최정상의 바둑 고수들 역시 자신이 이긴 원리를 제대로 설명하지 못한다. 
혼잡한 도로에서 운전하는 요령이나 다른 사람들의 얼굴을 구별하는 능력을 말로 설명하기 어려운 것과 마찬가지다. 
철학자이자 과학자인 마이클 폴라니가 “할 줄은 아는데 설명이 안 된다”훌륭히 요약해준 덕분에 이 현상은 
‘폴라니 역설’로 알려지게 됐다.

그럼에도 인류는 월급 처리부터 비행기 스케줄 최적화, 전화선 연결, 세금 정산 같은 복잡한 작업을 컴퓨터로 
자동화하는 데 성공했다. 하지만 컴퓨터 프로그램을 만들어본 사람이라면 그런 작업들의 순서를 얼마나 세밀하게 
지정해줘야 컴퓨터가 알아듣고 일을 할 수 있게 되는지 알 것이다.

작업의 내용과 순서를 고통스러울 정도로 상세히 정의해 컴퓨터 프로그램을 만드는 방식은 제한적일 수밖에 없다. 
바둑 같은 고난도 게임은 물론 사진 속에서 동일한 물건을 인식하는 능력도 프로그램으로 구현하긴 어렵다. 지구상에서 
쓰이고 있는 수천 개 언어를 번역하거나 헤아릴 수 없이 많은 질병을 진단하는 능력도 프로그램화하기는 난망이다.
 
기사 이미지
IBM의 딥블루는 100% 컴퓨터 기능만으로 체스 경기에서 가능한 수백만 개의 수를 
기억해 인간을 이기는 능력을 보여줬다. 
그러나 바둑에서 돌을 놓는 경우의 수는 체스와는 비교할 수 없이 많다. 
우주의 원자 수보다 많다는 추산이 나올 정도다. 
이 때문에 아무리 계산능력이 빠른 컴퓨터라도 바둑에서 유의미한 경우의 수를 
전부 시뮬레이션할 수 없다. 
무엇보다 어떤 수부터 먼저 계산해야 하는지조차 탐지하기 힘들다.

그렇다면 알파고는 뭐가 다르길래 이세돌을 물리쳤을까? 알파고 제작진은 
이세돌을 이길 가능성이 있는 전략 여러 개를 컴퓨터에 입력하는 방식을 버렸다. 
대신 대국 내용을 컴퓨터가 분석해 스스로 성공 전략을 알아내는 기계학습 방식을 선택했다. 
알파고의 승리는 이처럼 참신하고 도전적인 접근이 얼마나 큰 성과를 냈는지 잘 보여준다. 
기계학습 방식은 구조화된 작업 수행에 익숙한 인간의 관성적 지식에 의존하지 않는다. 
그렇기에 ‘할 줄 알지만 설명이 안 되는 대상’을 두려워하지 않는다.

알파고도 기존의 검색 알고리즘을 이용해 다음 수를 결정할 때가 있긴 하다. 
그러나 알파고의 진정한 파격은 폴라니 역설을 극복하는 괴력에서 나온다. 
알파고는 예제 학습과 경험을 통해 스스로 성공 전략을 구상한다. 
예제는 2500년에 달하는 바둑 역사에 축적된 고수들의 대국 기록에서 얻는다. 
이를 바탕으로 승리하는 전략을 끌어내기 위해 알파고는 ‘딥러닝’ 방식을 활용했다. 
빅데이터를 통해 핵심 대국 패턴을 추출하고 이해하는 놀라운 학습 능력이다.

우리 뇌는 학습 과정에서 뉴런을 형성하고 뉴런들 사이를 연결한다. 딥러닝은 이런 인간의 뇌와 흡사한 학습 방식을 택했다. 
이 때문에 ‘신경망’으로 불리기도 한다. 
소프트웨어 속에서 수십억 개 노드와 연결망을 만들고 예제를 훈련 도구로 활용해 자극(바둑)과 그에 대한 반응(다음 수)의 
고리를 만든다. 그 뒤 프로그램을 새로운 자극에 노출시켜 어떻게 반응하는지 살핀다. 
알파고는 이세돌과의 경기에 앞서 자기 자신과 수백만 번 대국했다. 
이 과정에서 ‘강화학습’이라 불리는 또 다른 기술을 활용해 가장 효과적인 수와 전략을 축적했다.

딥러닝과 강화학습은 새로 등장한 개념은 아니다. 하지만 그 효과와 적용 범위는 최근에야 윤곽이 잡혔다. 
덕분에 이를 응용한 인공지능 프로그램들은 급속도로 개선되고 있다. 
어디까지 발전할지 끝을 짐작할 수 없을 정도다. 
음성 인식부터 신용카드 사기 적발, 질병 진단 등 적용 범위도 대단히 넓다. 
이미 기계만으로 얼굴 인식과 자동차 주행이 가능해진 배경도 여기 있다. 
얼굴 인식과 무인 자동차 모두 폴라니가 ‘할 줄 알지만 말로는 안 되는 것’이라 지정한 분야였다.

아직 갈 길은 멀지만 인공지능 발전의 의미는 엄청나다. 
240년 전 제임스 와트가 증기엔진을 발명했을 때와 같은 혁명적 상황이다. 
인공지능 기술을 매개로 한 사회 변화는 우리 경제 전반에 심오한 파급을 가져올 것이다. 
다만 인공지능 기술 발전이 모든 인류에게 똑같은 혜택을 준다고는 장담할 수 없다. 
인공기술의 급성장이 가져다준 이득과 부작용을 해결하는 일만큼은 어떤 기계도 해낼 수 없는 인간의 역할로 남을 것이다.

앤드루 매카피 MIT대 교수

◆원문은 중앙일보 전재계약 뉴욕타임스 신디케이트 3월 30일 게재



*** 각주 **

딥 러닝(deep learning)

  

컴퓨터가 여러 데이터를 이용해 마치 사람처럼 스스로 학습할 수 있게 하기 위해 인공 신경망(ANN: artificial neural 

network)을 기반으로 한 기계 학습 기술. 


딥 러닝은 인간의 두뇌가 수많은 데이터 속에서 패턴을 발견한 뒤 사물을 구분하는 정보처리 방식을 모방해 

컴퓨터가 사물을 분별하도록 기계를 학습시킨다. 


딥 러닝 기술을 적용하면 사람이 모든 판단 기준을 정해주지 않아도 컴퓨터가 스스로 인지·추론·판단할 수 있게 된다. 

음성·이미지 인식과 사진 분석 등에 광범위하게 활용된다. 

구글 알파고도 딥러닝 기술에 기반한 컴퓨터 프로그램이다 


[네이버 지식백과] 딥 러닝 [deep learning] (한경 경제용어사전, 한국경제신문/한경닷컴 )


강화 학습(Reinforcement learning)


강화 학습(Reinforcement learning)은 기계 학습이 다루는 문제 중에서 다음과 같이 기술 되는 것을 다룬다. 

어떤 환경을 탐색하는 에이전트가 현재의 상태를 인식하여 어떤 행동을 취한다. 

그러면 그 에이전트는 환경으로부터 포상을 얻게 된다. 포상은 양수와 음수 둘 다 가능하다. 

강화 학습의 알고리즘은 그 에이전트가 앞으로 누적될 포상을 최대화 하는 일련의 행동으로 정의되는 

정책을 찾는 방법이다  (위키 백과)