알파고 개발자 "인간-인공지능, 누가 이기냐고? 물음에 답하려 대국 열었다"

[이데일리 오희나 기자] “이세돌과 알파고, 인간과 인공지능 가운데 누가 이길까? 이 질문에 답하기 위해 대국을 준비했다.”

데이비드 실버 구글 딥마인드 리서치 사이언티스트(구글 딥마인드 강화학습 총괄)는 8일 경기창조경제혁신센터에서 열린 국제 컨퍼런스에서 “바둑은 AI에게는 난공불락의 영역으로 알파고는 가장 어려운 대상과 싸우고 있는 것”이라며 “이세돌 선수와 알파고 가운데 누가 이길까에 대한 질문이 많은데 미지수가 많기 때문에 예측하기 어렵다. 우리도 이 질문에 답하기 위해 대국을 준비했다”고 강조했다.

실버 교수는 이번 대국을 통해 알파고가 몬테카를로 방식과 정책망·가치망 학습을 통해 얼마나 빠른 속도로 발전됐는지 가늠할 수 있을 것이라고 강조했다.

이번 대국에서 어떠한 결과가 나올지 예측하기 어렵지만 어떤 결과가 나오든 흥미롭다면서 이번 대국은 알파고가 가는 ‘긴 여정의 첫 걸음’이 될 것이라고 강조했다.

실버 교수는 “이번 대국을 통해 알파고는 한단계 더 높은 수준으로 발전할 것”이라며 “알파고는 범용 목적으로 만들었다. 머신러닝을 통해 새로운 것을 학습하고 다른 분야에서도 활용될수 있도록 하는 것이 목적”이라고 강조했다.

이어 “강화학습과 지도학습 등 지속적인 학습 과정을 통해 향후 의료용 더나아가 가정용 로봇까지 생각하고 있다”며 “구글의 최종 지점은 보다 많은 사람들이 의미있는 방식으로 정보에 접근하고 이를 통해 자신의 목표를 달성할수 있도록 수단을 지원하는 것”이라고 강조했다.

최근 구글은 영국의 국립보건국과 협력해 맞춤형 의료 서비스를 개발하겠다고 밝혔다. 개인 의료 데이터를 학습해서 맞춤형 치료 서비스를 구현하겠다는 것이다.

구글 딥마인드 알파고(AlphaGo)의 인공지능 알고리즘은 기존 몬테카를로 트리 탐색(MCTS) 방식에 컨볼루션 신경망(CNN)을 통한 딥러닝 방식이 적용됐다.

실제 바둑기사의 착수를 학습한 정책네트워크(Policy Network)와 국지적인패턴인식으로 승산판단을 위한 가치네트워크(Value Network)를통해 학습시켰다. 프로바둑 기사들의 착수전략을 학습하는 지도학습(Supervised learning) 방식과 스스로 자기자신과 경기해 학습된 전략을 강화하는 강화학습(Reinforcement learning) 방식을 적용한 것이다.

업계에서는 IBM ‘딥블루’가 체스 경기에서 인간을 이겼을 당시 처럼 알파고가 이세돌 선수를 이긴다면 많은 변화가 일어날 것으로 예상하고 있다. 특히 바둑은 우주의 원자수보다 많은 10의 170승 가량 경우의 수가 존재하기 때문에 인간의 직관만이 풀수 있는 영역이라고 평가돼 왔다.

그렇기 때문에 알파고가 이번 대국에서 한번이라도 이긴다면 AI 역량이 한단계 올라서는 것 뿐만 아니라 과학기술계에 한 획을 긋는 사건으로 기록될 것으로 보인다.

실버 교수는 “딥블루는 체스경기를 통해 AI의 역량을 입증했다. 딥블루 자체는 체스 이외에 다른 곳에서 적용이 어렵지만 다른 분야에서 각각의 AI가 등장했따”며 “이번 대국을 계기로 여러 가지 다양한 연구가 나오기를 기대한다”고 강조했다.