알파고 벽돌깨기 게임 학습 능력
본문 바로가기
산업/산업기술

알파고 벽돌깨기 게임 학습 능력

by 깨알석사 2016. 3. 20.
728x90
반응형



Google DeepMind created an artificial intelligence program using deep reinforcement learning that plays Atari games and improves itself to a superhuman level. It is capable of playing many Atari games and uses a combination of deep artificial neural networks and reinforcement learning. After presenting their initial results with the algorithm, Google almost immediately acquired the company for several hundred million dollars, hence the name Google DeepMind. Please enjoy the footage and let me know if you have any questions regarding deep learning!




알파고에게 어떠한 사전 정보도 주지 않고 단순하게 "최고치 점수를 올려라" 는 명령만 입력

게임 방법이나 게임 진행에 대한 룰도 가르쳐 주지 않았다.



처음에는 게임 방법을 몰라 점수를 올리지 못하고 고전.

하지만 시간이 지날수록 게임 방법을 자가 습득하여 점수치를 높여간다.







유투브 상에서 알파고의 게임으로 링크된 게임 영상들 (팩맨)





알파고라는 하나의 단일 지능이라기 보다는 구글 딥마인드에서 여러가지로 개발 중인 다중 형태의 인공지능들 중 하나로 보인다.

그 중에 바둑에 최적화 된 것이 알파고라고 봐야겠징...알파고가 아닌 딥마인드 또는 AI 로 검색하면 더 많은 인공지능의 게임 플레이 영상을 찾아 볼 수 있는데 게임에 최적화 되어 사람과 대결 할 수 있는 또 다른 게임용 알파고가 존재한다고 이해해야 할 것 같다.



원래 딥마인드라는 회사가 있는데 그걸 구글이 인수했으니 인수 되기 이전부터 이런 인공지능 개발과 관련한 결과물이 있었을 것이다. (그러니 인수했겠지..) 창업 초기의 결과물과 구글로 인수되고 나서의 결과물도 많이 다른 듯 싶고 초기에는 단순한 그래픽의 게임 등으로 연구를 했던 것으로 보인다. 










수퍼마리오는 우리가 아는 그 알파고는 아닌 듯 싶다. 그 이전부터 컴퓨터 게임안에는 원래 인공지능 형태의 컴퓨터 게이머가 존재하고 있고 스타크래프트 게임에서도 컴퓨터와 대결하는게 원래부터 존재하였듯이 인공지능 형태는 과거부터 쭉 있었는데 최근에는 입력된 정보외 자기 스스로 학습하여 게임 방법을 터득해 새롭게 변형해서 가르쳐 주지 않아도 알아서 하는 스타일을 주 목적으로 개발하는 것 같다.



최고 점수를 올려라. 이 단순한 명령 하나만으로 스스로 게임 방법을 습득해 점수를 올렸다는 말인데...

지구를 깨끗하게 만들어라, 전쟁을 사라지게 만들어라, 지금보다 더 좋은 지구 행성으로 만들어라 식으로 단순하게 입력한다면......백퍼.... 컴퓨터는 모든 경우의 수를 따져 최종적으로 가장 좋은 방법을 찾아 실행할 것이다. 그건 뭐 당연히 인류의 제거, 인간멸종~





딥마인드 AI의 인베이젼 게임 플레이




728x90
반응형

댓글