이세돌 VS 알파고(AlphaGo) - 구글 인공지능과 세기의 프로 바둑 기사의 한판승
본문 바로가기
산업/산업기술

이세돌 VS 알파고(AlphaGo) - 구글 인공지능과 세기의 프로 바둑 기사의 한판승

by 깨알석사 2016. 3. 8.
728x90
반응형



AlphaGo 알파고


구글에서 만든 인공지능이다. 지금까지 컴퓨터와 인간이 대결한 게임은 꽤 많았다. 대표적인게 체스, 하지만 바둑에서는 컴퓨터가 인간의 한계를 넘지 못한 유일한 종목으로 컴퓨터가 정복하지 못한 미지의 세계로 남아 있다.



알파고는 구글이 만든 바둑 프로그램이다. 알려진 바에 따르면 기존에 알려진 바둑 플레이 100만 게임을 학습했다고 한다.

단순 수치로 와닿지 않을텐데 인간으로 따진다면 천년동안 먹지도 자지도 않고 천년동안 바둑 학습을 한 결과와 비슷하다고 보면 된다. (절대 만만한 녀석이 아니라는 거) - 누가 천년동안 기원에서 바둑 연구만 했다고 해봐라.....헐~ 내공이 어마어마 하다는 뜻이다. 100만 바둑 플레이를 학습하는데 소요된 기간은?............4개월....겁나게 짧다고 볼 수도 있지만 수퍼컴이라는 전제에서 보면 짧은 기간이라고도 단정하기 힘들다. 얼마나 자료가 많기에....ㅡ..ㅡ 



수퍼컴이 4개월간 밤낮없이 미친듯이 학습해도 모든 대국의 수를 완전히 다 배우지 않았다는 말이 될 수도 있어 바둑의 세계는 끝이 없어 보인다.



알파고가 유명해 진 건 작년 프로 바둑기사를 상대로 승리를 했기 때문이다. 바둑 유럽 챔피언 팡 후이와 5번 대결했는데 5전 전승을 알파고가 이루어냈다. 바둑에서 프로기사를 상대로 처음으로 컴퓨터가 이긴 순간이며, 그게 알파고다



알파고와 이세돌의 대결처럼 강한 상대끼리 붙는 경우에는 포인트가 단순하다. 누가 잘 하느냐가 아니라 누가 먼저 실수하느냐. 인공지능이라고 하지만 패턴을 입력해 연산 처리하는 것이 컴퓨터의 한계다. 하지만 알파고는 인간이 기억하고 저장하는 기억장치와 연산장치가 월등하게 뛰어 날 수 밖에 없어 결국 대국의 수, 경우의 수를 누가 많이 알고 누가 많이 쓰느냐인데 알파고가 100만 게임을 학습했다고 하는 것처럼 바둑이라는게 장기나 체스, 오목처럼 다른 게임 보다는 경우의 수가 워낙 많아 알파고가 불리하다고 볼 수도 없다.



또한 무엇보다 컴퓨터의 강점이, 냉정함. 즉 사람간 대결에서는 어떤 상황이든 심리전이 있기 마련이고 마음이 흔들리느냐, 정신이 흐트러지느냐도 굉장히 중요한데 컴퓨터는 그런게 없다. (모든 스포츠나 지능대결에서 강자가 무너지는 이유는 멘탈 붕괴가 거의 원인이다) 거기에 그날의 컨디션과 몸 상태도 인간은 중요하지만 컴퓨터는 그런게 없으니 이세돌 기사가 최상의 컨디션이 아니라면 이세돌 기사의 승리도 장담 할 수는 없을 것이다. 결국 알파고와의 승부에서 가장 중요한 건 심리싸움이 안되는 상황에서 인간인 이세돌 기사의 정신 상태와 마음가짐이 얼마나 무저지지 않고 잘 버틸지가 관건이다. 



알파고가 기존 컴퓨터 바둑 프로그램과 다른 가장 큰 차이점은 머신러닝, 말 그대로 기계학습으로 여러 빅데이터를 모아 수집한 뒤에 분석하고 그 패턴을 읽어서 다른 수를 찾아내는 기술을 가지고 있다. (확실히 진보된 인공지능인 셈) 기존 바둑 프로그램은 입력된 패턴이나 경우의 수를 읽어서 대결한다고 하면 이 입력된 데이터가 많지 않거나 접하지 못한 수가 나올 경우 그 수의 목적을 읽지 못하고 다른 수를 놓게 된다. 반면 머신러닝처럼 학습이 가능하다면 입력되고 학습한 데이터를 가지고 자기 스스로 더 많은 경우의 수를 계속 만들어 수를 읽기 때문에 인간이 찾지 못한, 또는 잘 모르는 수까지 파악할 확률이 높아진다.



과거의 바둑 프로그램이 패배를 하면 그냥 게임오버가 되지만 알파고와 같은 경우에는 컴퓨터 스스로가 그 패배를 분석해 어느 시점에서 수가 잘못 되었는지, 어떤 패턴에 문제가 생겼는지를 찾아 검토 한 뒤 다음 경기에 활용하여 바둑 실력을 보강한다는 것이 차이다. 같은 수에서는 절대 지지 않게 되는 셈이다. 



프로기사 정도 되거나 아마급수가 높은 사람은 바둑을 둘 때 상대가 컴퓨터인지 사람인지 알 수 있다고 한다. 컴퓨터는 전체 패턴을 읽어 그에 맞는 수를 놓게 되는데 그 패턴에서 다른 양상이 보일 경우 스스로 수를 완성하지 못하고 다른곳에 두는 경우가 생긴다. 어느 자리에 상대 돌이 올라오면 그 다음에는 이 자리에 놓아야 한다는 공식을 갖고 있는데 만약 인간이 전혀 엉뚱하거나 컴퓨터가 미처 알지 못한 패턴의 자리에 돌을 놓으면 수 자체는 읽지 못하기 때문에 엉뚱하게 놓게 되고 결국 그런 스타일은 간파당하기 쉽다. 컴퓨터에 깔린 체스게임도 비슷하다. (스킬의 변화가 없다) 그러나 알파고는 대국만 놓고 보면 사람인지 컴퓨터인지 전혀 알 수 없다고 한다. 자가학습을 통해 실제 사람처럼 수를 읽고 패턴을 분화시켜 분석하기 때문이다.



기자회견을 보니 이번 알파고와의 대결을 위해 이세돌 기사도 잠자기 전 두세시간은 컴퓨터와 바둑 대결 연습을 한다고 한다.



아마도 컴퓨터들이 두는 바둑 스타일을 연구하기 위함 같은데 기존의 바둑 프로그램과는 차원이 다르다고 알려진 게 알파고이니 만큼 대결 당일 알파고의 진정한 능력을 볼 수 있는 기회이기도 하다.



구글 측에서도 이세돌의 능력을 무시할 수 없는지 이번 대결에서 알파고의 승리여부를 50대50으로 보고 있다. 무조건 이기거나 이길 수 있다가 아니라 세기의 강자이니 만큼 이번에 확실히 검증을 받겠다는 것인데 컴퓨터라고 해서 과거의 기술 발전 속도와 지금의 속도가 다르고 무엇보다 이 알파고가 구글의 프로그램이라고 하니 싱겁게 게임이 이루어지지는 않을 것이다.



10년전 컴퓨터 기술과 5년전의 기술, 그리고 지금의 기술은 완전히 다르다. 휴대폰만 해도 5~6년 전 스마트폰이라는게 대중적이지 않았을 때만 해도 우리는 잘 안다. 불난 집에 기름을 붓듯이 마치 속도에 가중속도가 붙어 더 빨리 더 똑똑하게 진화하고 있는게 컴퓨터의 지능이라 1~2년 전, 또는 기존의 컴퓨터 바둑 게임과는 단순 비교하기도 힘들어 보인다.



5번의 경기를 5일에 걸쳐 나눠 하는데 이 자체만 보더라도 인간의 한계가 보인다. 사람은 기계가 아니기 때문에 쉬어야 하고 먹어야 하고 잠을 자야 해서 5게임을 하루에 다 할 수 없다 (바둑이라는 게 그렇게 빨리 끝나는 것도 아니니..) 컨디션이라는 말 자체가 없는 알파고에게 이런 부분 자체가 강점일 수 밖에 없다. 작년 처음으로 인간 프로기사에게 이겼을 때, 알파고에 진 중국 기사는 알파고가 속도조절(?)을 해서 신경 쓰였다고 인터뷰를 한 적이 있다. 일반적으로 컴퓨터는 내가 수를 놓으면 빠른 시간안에 수를 놓게 되는데 알파고는 마치 사람이 생각하 듯 수를 놓는 시간이 들쑥날쑥, 심지어 꽤 오랫동안 돌을 놓지 않아 중국 기사를 똥줄타게 만들었다고도 한다. (우리가 쓰는 컴퓨터는 바로바로 맞수를 두는 게 보통) - 이는 결국 수를 보고 그 때마다 분석하는데 시간이 소요되었다고 생각 할 수 있어 수를 읽는다는 말도 된다



알파고와 5전 3승제로 벌이는 이번 대결은 3번을 이기더라도 5전 경기 모두 치룬다고 한다. 승리 보다는 승부, 그리고 거기에서 얻게되는 갑진 빅데이터 (바로 이세돌과 경기에서 얻게되는 이세돌의 바둑 수) 를 얻을 수 있기 때문이라고 보여진다.



체스는 이미 컴퓨터가 세계 챔피언이다. (체스 세계 챔피언이 패배) 

체스에서 나올 수 있는 모든 경우의 수를 다 가지고 있어서 이길 수 밖에 없었다고 한다. 바둑이 체스와 달리 난공불락 요새인 것은 경우의 수가 어마어마하기 때문이다. 모든 수를 다 안다고 해도 변칙적인 플레이까지 감안한다면 끝이 없을 수도 있다.  변칙적인 플레이에도 알파고가 얼마나 잘 대응할 수 있는지가 이번 대결의 묘미다.



아주 오래전 장기 좀 둔다고 생각한 나에게 10전 10패를 안겨준 사람이 있었다. 하도 억울해서(?) 수소문 끝에 장기 고수에게 전수 좀 해달라고 했더니 10개의 수를 알려준 적이 있다. (겨우 10개? ㅡ..ㅡ) 이게 차 따먹기, 포 따먹기, 상 따먹기 기술인데 졸, 포, 상, 차가 각각 쌍으로 이루고 있으니 사실 10개만 알아도 백전백승인 셈이다.



단순하게 눈 앞에 놓인 수를 그때마다 생각해서 놓는다고 생각하기 쉽지만 원래 시작부터 패턴이라는게 존재한다. 장기도 똑같다. 차 따먹기 기술 들어가면 그걸 처음부터 눈치채고 알아내지 못하면 무조건 차는 잃게 되어있다. 상대방의 졸이 어디로 움직이냐에 따라 그게 단순히 한칸 이동으로 보일 수도 있지만 그게 원래 "수"라면 바로바로 대처를 해야 막을 수 있다.



10개의 필승법을 가지고 나에게 10패를 안겨준 사람을 찾아갔다. 그리고 1분도 안되서 시작부터 차부터 낼름 받아 먹었다. 상대가 어찌나 당황하던지, 멘탈이 우수수수 무너지는 소리가 다 들렸다. 그 때 전수 받으면서 알았다. 내가 포나 차를 먹겠다고 움직이면서 두 수, 세 수를 먼저 본다 하지만 하면서도 "제발 그 쪽으로 오지마라. 저쪽으로 와라. 내가 이걸 왜 놨는지 제발 몰라라~" 이러고 살았다. 그런데 그 수라는게 참 묘해서 이미 패턴이 정해져 있더라.



내가 차를 먹겠다고 첫 수를 두면 상대가 어떻게 움직이냐에 따라 맞춰두면 되는데 그게 [이미 정해져 있다] 본격적인 사냥이 시작되면 상대가 드디어 인지하게 되지만 어떻게 하더라도 그 사람이 놓을 수를 미리 알고 있기 때문에 사냥이 성공하게 된다. (배울 때 고수에게 나는 이런 질문을 했다. 상대방이 거기에 안 놓으면, 다른데 놓으면요? 하고 물었더니 그런거 걱정하지 말라 하더라, 무조건 내가 생각한 자리에 가게 되어 있단다. - 실제로 다 그랬음) 겨우 10개 가지고도 신나게 복수를 했는데 장기에 있는 모든 경우의 수를 다 파악한다면 평생 내기 장기로 돈 벌어 먹고 살아도 된다고 생각이 들기도 했다. (그래서 노인 많은 곳에 가면 장기고수가 내기장기로 노인네들 용돈 가지고 간다) 



뭐 사람끼리 하는 일반 지능대결도 마찬가지, 알려진 셈법, 넌센스 문제, 시중에 많이 알려진 천재 문제들을 오랫동안 탐독하고 학습하다보면 비슷한 유형은 금방 쉽게 풀게 된다. 똑똑한 천재, 퀴즈 잘 풀고 문제 잘 푼다고 다 천재는 아니다. 학습량에 비례해서 똑똑해 보일 뿐이고 실제로 문제만 잘 풀 뿐이다. 처음에 데이터가 없을 때는 당황하지만 익숙한 문제가 많아지면 응용해서 쉽게 푸는데 그런 학습량과 분석이 인간이 가진 장점이라면 그걸 알파고도 가지고 있다니 볼만한 대결이 되는 것이다.



더 지니어스나 비밀의 방, 문제적 남자처럼 문제풀이 방송 프로그램이 많은데 사실 그런 포맷은 외국방송에 이미 많이 있다. 그리고 국내에 나온 문제 다수는 이미 알려져 있거나 변형된 것으로 외국방송을 먼저 시청했다면 쉽게 풀 수도 있는 경우가 많다.



IQ도 마찬가지. IQ는 모든 인간이 시간이 지날수록 지능지수가 높아지며 그게 당연하다는 연구도 이미 존재한다. 알파고가 이제 한다는 러닝, 즉 학습을 인간은 매초, 매분, 매일 하기 때문에 지능은 멈추지 않기 때문이다. (공부만 하는게 아니라 먹고, 자고, 생활하고 사람 만나고, 일하는 모든게 학습이 되고 자료가 된다)



내 아이큐가 100이야, 내 아이큐는 98이야 하더라도 그건 측정 당시이고 시간이 지날수록 지수는 계속 높아지게 되어 있는데 뇌의 한계, 즉 본격적인 쇠퇴와 함께 급속도로 그 속도가 증가하는 노년층이 아닌 이상, 평균적으로 자신이 알고 있는 아이큐에서 10~20은 더 높은게 지금 아이큐라고 할 수 있다. 



장기에서는 경우의 수를 얼마나 많이 알고 그 수(패턴)을 일찍 알아내어 방어하거나 공격하느냐인데 단순하게 보면 알파고가 유리할 수 있다. 하지만 바둑이 어디 같은가..더군다나 알파고마저 알아내지 못한 변칙 플레이, 또는 데이터에 없는 수가 나온다면 알파고도 무용지물이 될 것이다.  컴퓨터도 천년치 학습량을 공부했다고 할 정도로 그 수가 너무 많은데 이세돌도 만만치 않은 사람이니 만약 이세돌이 전승 내지 3승을 먼저 가진다면 천년치 바둑 학습량은 가지고 있는 셈이 된다.



알파고와 이세돌의 대국 룰은 덤 7.5집 (덤 : 먼저 두는 흑돌의 유리함을 상쇄하기 위한 패널티), 대국방식은 호선방식이다. (호선방식 : 급수차이만큼 미리 돌을 놓는 집바둑이 아니라 서로 대등하게 흑백을 바꿔가며 두는 방식) 대결은 구글 유투브에서 생중계



알파고 : 495전 494승 1패 (컴퓨터 간 대결 / 승률 99.8%) 5전 5승 무패 (인간 대결 / 승률 100%)

이세돌 : 세계랭킹 1위



지금까지 나온 예상은 이세돌의 5전 전승, 또는 4승 1패 (인간이라 실수 할 수 있다는 점에서 1패까지는 인정하는 분위기)

알파고의 기보는 공개되지 않아(작년 유럽 챔피언 중국 기사를 이긴 기보 외에는 알려진 기보가 전혀 없음) 알파고의 기보라고 추정되는 것만 있는데 꽤 놀라운 실력이지만 이세돌보다는 한 수 아래라는 말도 있다. 



이번 대결에서 우승 상금은 12억원이다.

아래 영상은 알파고에 대한 소개 및 활동 내용들



뜬금없는 말이지만...게임 잘하는 인공지능 컴퓨터도 나와서...

홍진호나 임요환과 스타게임으로 대결하는 것도 꽤 볼만하지 않을까 싶다...잘 막을 수 있을지..못 막을지..

스타크레프트 게임안에 있는 컴퓨터들은 ㅠ.ㅠ....지능이 없어 ㅋ











728x90
반응형

댓글