- 다양한 주제에 대해 자유롭게 글을 작성하는 게시판입니다.
Date | 16/02/16 23:08:24 |
Name | 커피최고 |
Link #1 | http://cyberoro.com/orozone/event/promotion/news_view.oro?div_no=12&num=521264&p_num=19 |
Subject | 알파고vs이세돌 대국을 기대하며.... |
세계바둑계에서 컴퓨터 인공지능의 첫 희생자가 된 판후이 2단은 2013-2015 유럽챔피언입니다. 하지만 그의 활동 장소에서 알 수 있다시피, 그렇게 기력이 뛰어난 기사는 아닙니다. 판후이의 유럽바둑연맹 엘로(ELO) 세계순위는 2월7일 기준으로 631위에 불과한 수준이죠. 실제 기보 자체를 두고도 말이 많습니다. "알파고와 판후이 2단의 다섯 대국에서 판후이는 이상할 정도로 제실력을 발휘하지 못했을 뿐 아니라 어떤 판은 보기 민망할..... 심지어 고의로 져준 것 아닌가 하는 의심이 들 정도인데, 좌우당간 모를 일이다. 아마도 오랫동안 바둑을 두지 않은 것 같다." 현재 중국바둑, 아니 세계바둑 최강자인 커제가 이 역사적인 대국의 기보를 보고 평한 내용입니다. '아무리 그래도 바둑인데... 기계가 되겠어?'에서 오는 방심과 이후의 당혹감 등이 판후이를 강하게 흔든 것이 아니냐는 이야기입니다. 기계와는 다른 인간적인 면모이겠죠. 글 서두서부터 판후이를 깎아내린 것은 사실 인간적인 거부감 때문일지도 모릅니다.(그런데 그가 진짜 형편없는 대국을 두긴 했습니다....) 이번 대국이 역사적으로 중요한 의미를 갖는 것은 인공지능이 인간을 이겼기 때문이기도 하지만, 보다 근본적으로는 '인간처럼' 두었기 때문입니다. 커제도 실제 기보를 보고 누가 사람이고 기계인지 구분을 못하겠다고 놀랐을 정도니깐요. http://cyberoro.com/orozone/event/promotion/news_view.oro?div_no=12&num=521264&p_num=19 이에 대해서 아주대학교 전자공학과 감동근 교수님이 상세한 내용이 담긴 기사 시리즈를 작성해주고 계십니다. 이전의 프로그램들과 이번 알파고의 차이는 몬테 카를로 기법에만 의존하다가, 신경망을 활용한 딥러닝 기법을 도입한 것이죠. 기사 내용을 복붙하자면, ///어떤 수의 좋고 나쁨을 판단할 때, 즉 수읽기를 할 때, 그 이후에 파생되는 모든 가지(tree)를 닥치는 대로(brute force) 탐색해야 한다면 두 가지 문제가 있다. 우선, 바둑은 경우의 수가 너무 많아서 아무리 강력한 계산력을 지닌 컴퓨터라도 한정된 시간(예를 들어 30초 초읽기) 내에는 전체 탐색 공간의 극히 일부 밖에 탐색할 수 없다. 뿐만 아니라 종국까지 시뮬레이션 한 결과 이겼다고 했을 때, 그것이 내가 첫 수를 잘 둔 덕분인지, 상대의 응수가 나빴던 탓인지, 거기에 대한 내 응수가 좋았던 덕분인지…… 도무지 알기가 어렵다는 문제도 있다. ‘몬테 카를로’ 라는 단어는 샘플링(sampling)을 의미한다. 선거 결과를 예상할 때 전수조사를 하는 것이 불가능하므로 유권자의 일부를 표본으로 추출해서 여론 조사를 하는 것과 마찬가지이다. 이 수 이후에 전개될 수 있는 경우가 10,000가지 있다고 하면 그 중에 10가지만 임의로 따져보는 것이다. 그 결과 10번 중에 8번이 나쁜 결과(또는 패배)로 이어졌다면 그 수는 나쁜 수일 가능성이 농후한 것이다. 1,000개 중에 1개, 10,000개 중에 10개만 샘플링 했을 때는 표본의 특성이 전체의 특성과 다르게 나타날 가능성을 무시할 수 없지만, 100,000개 중에 100개, 1,000,000개 중에 1,000개 하는 식으로 숫자가 커지면 예외적인 상황이 발생할 확률은 급격히 떨어진다. 1997년의 체스 컴퓨터 딥 블루(Deep Blue)는 체스만을 위해 제작된 슈퍼 컴퓨터로서 초당 2억 개의 기물 이동을 계산할 수 있었다. 그러나 요즘에는 데스크탑에서 돌아가는 체스 프로그램도 세계 챔피언을 이기는데, 그것은 몬테 카를로 탐색 기법 덕분에 탐색 공간이 큰 폭으로 줄어든 덕분이다. 딥 블루는 초반이 약했다. 10의 10승의 50승의 경우의 수에는 초당 2억 회의 계산 능력도 별로 도움이 되지 못하기 때문이다. 그래서 IBM의 프로그래머들은 수십만 판의 체스 경기 결과를 데이터베이스화 하여, 체스 초반의 말 움직임 각각이 얼마나 자주 시도되며 또 각각의 초반 움직임이 얼마나 자주 승리나 패배로 이어졌는지 연구했다. “카스파로프는 컴퓨터와 체스를 두는 게 아니라, 체스 고수의 유령들과 체스를 두는 셈이다.”고 말할 정도로. 기존의 바둑 컴퓨터 크레이지스톤과 젠도 마찬가지다. 초반에 자주 사용되는 수법을 데이터베이스화해서 수읽기 만으로는 도저히 풀어갈 수 없는 초반을 그럭저럭 넘겨보자고 했다. 바둑에서 초반에 주로 귀에서 나타나는 쌍방 최선의 진행을 정석이라고 하는데 최대 2만 개 정도로 알려져 있다. 물론 이 중에 상당 수는 과거에는 정석이었는데 바둑 이론이 발전함에 따라 어느 한 쪽이 불리한 것으로 판명돼 더 이상 정석이 아닌 것으로 취급되기도 한다. 컴퓨터에게는 2만 개 모두의 정석을 외우는 것이 아주 쉬운 일일 것이다. 그런데 문제는 부분적으로 봤을 때 쌍방 최선의 진행이라는 것이지, 주위의 배석에 따라 정석의 유불리가 민감하게 달라진다는 점이다. 그래서 바둑에서는 “정석을 공부하되 그 의미를 깨우친 다음에는 정석을 잊어버리라”고 가르친다. 바둑 기술의 절반이 수읽기라면 나머지 절반은 소위 ‘감각’이라고 부르는, 모양(패턴)에 대한 이해력이다. 사람은 수읽기를 할 때도 감각을 바탕으로 탐색 공간을 몬테 카를로 기법보다 훨씬 더 효과적으로 줄여나간다. 특히, 초반 포석 단계에서는 수읽기보다는 감각 위주로 수를 결정한다. 알파고는 기존의 몬테 카를로 탐색 엔진에다가 사람의 ‘감각’을 흉내내기 위해, 패턴 인식에 뛰어난 성능을 내는 딥 러닝 기법을 접목한 것이다.////// 네, 대강 이런 내용입니다. 문과인 저도 이해하기 쉽도록 정말 친절하게 설명해주셨네요. 주목할 점은 인용한 부분의 마지막 문단입니다. 바둑이 체스보다 어려운 것은 논리적인 부분뿐만 아니라, 감각적인 부분까지 요구하기 때문입니다. 바둑은 본래 "예"로서 여겨지던 것이기에 모양과 그 이면의 철학을 매우 중시하던 게임이었기 때문이죠. 소위 말하는 초반 '정석' 역시 같은 맥락에 있습니다. 하지만 바둑이 더더욱 어려운 것은 이런 감각적인 부분들이 쌓이고 쌓이다보면, 끝내는 논리적인 부분으로 귀결된다는 점에 있습니다. 써놓고도 제가 무슨 말을 하는건지 모르겠지만, 아무튼 바둑을 두다보면 "아, 저 수가 이렇게 다가오는구나!" 이럴 때가 있죠. 논리와 감각, 이 둘 사이에서 조화를 이루는 게임이 바둑이라면 이제까지 컴퓨터 인공지능은 바둑의 논리적인 부분만을 막대한 샘플링으로 이해하려만 하다가, 이제서야 감각적인 부분도 이해하고 있다.... 고 생각하면 될 것 같습니다. 자연스럽게 이번 구글팀의 연구 초점도 바둑의 '감각'적인 측면에 맞춰져 있기 마련이고, 실제로 프로기사들이 기보를 보고 평한바에 따르면, 지나치게 '모양'을 중시하는 바둑이라고 합니다. 뭐 과도기적인 부분인 것이죠. 그래서 곧 다가올 이세돌과의 승부에서 모든 사람들이 이세돌이 손쉽게 이길 것이라고 이야기합니다. 그러나 공식적인 석상에서는 그 어조가 매우 조심스러운데, 그 이유는 알파고가 ‘천 년치’ 기보를 몇 주 만에 ‘학습’했다는 이야기가 두려움을 갖게 하기 때문입니다. 재미있는 점은 저 기보들 중에는 인터넷 바둑 5-9단들의 대국 16만판이 있다는 것입니다. 프로수준보다 한참 떨어지는 하수들의 대국을 왜 학습한 것일까요? 온갖 저질스러운 '떡수'들이 난립하는 인터넷 바둑판인데 말입니다... //인공 신경망에게 ‘학습’이란 각 노드 간의 연결 가중치를 계산하는 작업이다. 알파고는 19 x 19 x 48 (=17328)개의 입력을 받아들이고, 13개의 은닉층을 사용한다. 따라서 계산해야 될 미지수(연결 가중치)의 개수가 적어도 수백만 개에서 아마도 수천만 개가 될 것으로 추측된다. 이를 계산하는 다양한 수학적 기법이 있지만 거칠게 비유하자면, 수백만 개의 미지수를 갖는 연립 방정식을 풀려면 적어도 그만큼의 조건이 필요한 것이다. 즉, DeepMind 입장에서는 알파고의 신경망을 학습시키는데 필요한 최소한의 데이터를 확보하기 위해, 프로의 기보에서 출발해서 인터넷 바둑 9단간의 대국, 8단간의 대국…… 내려가다보니 5단 바둑도 볼 수 밖에 없었던 것 같다. 패턴 인식 분야에서는 사진의 크기를 줄이거나, 색을 바꾸거나, 회전시키는 등 간단한 조작으로 원래 이미지를 변형해(image augmentation) 학습에 필요한 데이터 개수를 늘리는 방법이 있으나, 바둑에서는 돌이 놓인 위치가 한 줄이라도 달라지면 상황이 전혀 달라지는 경우가 많으므로 회전 외에는 이런 기법들의 적용이 어려울 것으로 생각되기 때문이다.// 뭐 이렇게 설명하시네요. 아무튼 상기한 내용 때문에, 이세돌을 이기기 위해서는 보다 고급진(?) 기보만을 연구한 알파고2를 따로 준비해야하는게 아닌가라는 이야기가 나오고 있습니다. 또 인간이 160판 정도 두면 알만한 것을 기계는 16만판이나 해봐야 아는거 아니냐는 역발상의 인간찬가(?)적인 발언도 나오고 있고요. 여러모로 흥미로운 대결이 아닐 수 없는데, 바둑에 큰 관심을 두지 않는 분들이라도 인간사적인 측면에서 지켜보시면 재미있을 것 같습니다. “체스판 위에서 인간과 컴퓨터가 격돌하면 최고의 체스 실력을 가진 인간의 독창성과 수학자, 전산학자, 엔지니어의 축적된 연구결과가 대결을 벌이게 된다. 인간과 기계의 대결은 기계가 사고능력이 있음을 보여주려는 것이 아니라 인간이 공동으로 만든 연구결과가 가장 재능 있는 인간을 뛰어넘을 수 있는 지를 보여주려는 것이다." 유명한 체스프로그램, '딥블루' 개발팀의 이야기입니다. 이런 관점으로 바라보니, 알파고에 대한 저 자신의 인간적인 거부감이 많이 희석되더군요. 그래도 다가올 대국은 뛰어난 인간이 승리하길 바랍니다. 4
이 게시판에 등록된 커피최고님의 최근 게시물
|