알파고의 시작, 신경과학자와 인공지능 전문가의 만남
알파고의 아버지는 딥마인드 최고경영자(CEO) 데미스 하사비스다. 유소년 세계 체스 챔피언이었던 하사비스는 케임브리지대에서 컴퓨터공학 학사를, 유니버시티칼리지런던(UCL)에서 인지신경과학 박사 학위를 받았다. 하사비스는 10대 때 세계적인 게임 ‘테마파크’를 만들 정도로 게임에도 조예가 깊었다.
신경과학자였던 하사비스의 일생이 바뀌게 된 것은 UCL에서 인공지능 전문가 셰인 레그를 만나면서부터다. 이들은 사업가였던 무스타파 술레이만(Mustafa Suleyman)과 힘을 합쳐 2010년 인공지능 스타트업 ‘딥마인드’를 런던에서 창업했다.
|
몬테카를로 트리서치는 기존 무작위 검색 방식에서 한걸음 더 나아간 기술이다. 몬테카를로 방식은 일종의 ‘표본조사형 여론조사’ 다. 수많은 선택지중 과거 전문가들의 선호도를 감안해 검색 범위를 좁혀간다. 경우의 수가 줄어들수록 성공 선택의 확률이 높아지는 식이다.
딥마인드는 인공지능이 자가학습을 하도록 했다. 인간이 눈과 귀로 들은 정보를 수집하고 이를 판단하기까지 수많은 학습을 반복하는 것처럼 방대한 데이터를 스스로 판단해 추론할 수있도록 했다. 이른바 ‘딥러닝’이다.
알파고, 구글 품에 들어가면서 비약적으로 성장
이때부터 하사비스 CEO와 딥마인드 개발팀은 ‘대중적으로 보여줄 수 있는 인공 지능’을 연구했다. 딥마인드는 그 대상으로 바둑을 선택했다. 알파고의 시작이었다.
초기 알파고는 주어진 데이터에 따라 반응했다. 인간이 절대적인 선생님이었고 알파고는 말을 배우는 아기와 같았다. 알파고는 이미 저장된 데이터를 바탕으로 다른 데이터를 판별하는 쉬운 기능부터 시작했다. 쉽게 말해 고양이의 사진을 갖고 개와 고양이를 구별하는 것이다.
데이터가 쌓이고 인공지능에 대한 판단이 정교해지면서 알파고는 ‘강화학습’에 들어갔다. 알파고가 공부한 기보는 15만 기사들이 남긴 수천만건의 기보였다. 알파고는 수천만건의 기보를 통해 승리에 도달할 수 있는 ‘대안’을 찾았다. 알파고가 상대의 수를 모방하는 차원을 넘어 ‘이기는 수’를 두게 된 단계다.
|
알파고의 기력에 대해서 바둑계는 “이젠 인정해야한다”며 “수준 높다”고 인정하고 있다. 천하의 이세돌 9단도 알파고의 실수가 없었으면 판 2단처럼 전패를 했을 수도 있다.
바둑 이긴 알파고, 하지만 이제 시작 단계
알파고의 다음 도전 단계는 범용화이다. 바둑 뿐만 아니라 스타크래프트를 비롯한 게임, 보건 의료 등에도 알파고의 학습 범위를 넓힐 방침이다. 빅데이터 기반의 머신 러닝이 접목된다면 어느 분야에나 알파고가 쓰일 수 있다는 게 하사비스 CEO의 생각이다.
다만 상용화 시점은 그도 섣불리 전망하지 못했다. 하사비스 CEO는 지난 13일 4차 대국후 기자회견에서 “보건·의료에 알파고가 쓰일 수 있지만 알파고는 베타나 알파도 아닌 프로토타입”이라고 말했다. 앞서 그는 인간의 뇌를 닮은 인공지능이 나오기까지 앞으로 수 십년이 더 걸릴 수 있다고 시사했다.
그럼에도 알파고의 다음 도전 대상은 이미 첫단추를 꿴 상태다. 구글내에서 인공지능 개발을 진두지휘중인 제프 딘 구글 시니어 펠로우 지난 9일 ‘머신러닝’ 컨퍼런스에서 고전 PC게임 스타크래프트 등의 게임도 도전대상이 될 수 있다고 했다.
딘 시니어펠로우는 “어떠한 기술이 됐던 간에 인류에게 유용할 수도 위협이 될 수도 있다”며 “이 부분은 공통된 고민”이라고 말했다.