지역별 뉴스를 확인하세요.

많이 본 뉴스

광고닫기

기사공유

  • 페이스북
  • 트위터
  • 카카오톡
  • 카카오스토리
  • 네이버
  • 공유

인공지능, 인간을 '속이다'…도박사 4명 AI와 포커 대결

한인 김동씨 유일하게 무패
인간이 패한 적 없는 게임서
예상 뒤엎고 AI가 승부 압도
"블러핑까지 하며 베팅해"

“내가 들고 있는 카드를 다 꿰뚫어 보고 마치 속임수를 쓰는 것 같았다.”

김동(28)씨는 졌다는 듯 고개를 저었다. LA출신 한인 김씨는 세계적인 프로겜블러다. 지난 11일부터 피츠버그의 리버스 카지노에서 열리고 있는 포커 대회 ‘Brains VS AI’에 참가중이다. 김씨 등 세계 포커 챔피언 4명이 카네기멜론대학팀이 개발한 인공지능(AI) ‘리브라투스(Libratus)’와 20일간의 마라톤 포커 승부를 벌이고 있다. 방식은 베팅 금액에 제한이 없는 텍사스 홀덤.

대회는 전세계의 주목을 받고 있다. 포커는 인공지능이 인간을 상대로 넘을 수 없는 ‘마지막 보루’로 인식되고 있어서다.

1997년 IBM의 ‘딥블루’가 체스를 정복했고, 지난해 3월 구글 딥마인드의 ‘알파고’가 이세돌 9단을 이겨 바둑판마저 점령했지만 포커 게임에서 인간을 이긴 AI는 아직 없다.
체스나 바둑과 달리 포커는 ‘불확실한 정보’의 게임이다. 상대가 들고 있는 카드를 볼 수 없기 때문에 확률 계산만으로는 이길 수 없다.



상대를 기권하게 하기 위해 가진 패를 속이는 ‘블러핑(bluffing)’이라는 변수 때문이다. 나쁜 패를 들고도 가진 돈을 다 ‘올인’할 수 있는 인간의 행위는 논리적 연산만 하는 AI가 이해할 수 없는 ‘도박’이다.

블러핑은 인간만이 갖고 있는 ‘직관(Intuition)’과 감정의 산물이라는 뜻이다. 리브라투스의 직전 AI 모델인 클라우디코(Claudico)가 2015년 5월 열린 같은 대회에서 4명의 포커 챔피언에게 패한 이유도 여기에 있다.

그래서 이번 대회에 앞서 세계도박 사이트들은 4:1 혹은 5:1로 AI의 패배를 전망했다. 김씨 등 포커 챔피언 4명도 대회 전날 “리브라투스가 아무리 잘해도 우리와 비기는 정도일 것”이라며 자신감을 나타냈다. 더우기 김씨는 2년 전 클라우디코를 이긴 바 있다.

하지만 첫날부터 리브라투스는 인간을 압도했다. 2만7000번의 승부에서 인간을 상대로 5만513달러를 땄다. 11일이 지난 23일 게임 수가 6만7000차례로 2.5배 늘어나는 동안 리브라투스가 딴 돈은 70만1242달러로 14배 폭증했다. 대회 16일째인 26일 현재 리브라투스가 딴 돈은 106만5429달러로 뛰었다.

인간 도박사 4명 중 3명이 AI에 졌다. 참가자 중 유일하게 김씨만 리브라투스와 대결에서 6만5711달러를 따서 이기고 있다. 지난해 이세돌 9단에 이어 도박 대결에서도 한국인이 인간 대표로 AI에 선전하고 있다.

김씨는 “리브라투스는 인간이 할 수 있는 모든 기술을 조금씩 보여줬다”면서 “흔한 패턴이 없었고 패의 좋고 나쁨과 상관없이 베팅했다”고 전했다. 쉽게 말해 컴퓨터가 인간을 상대로 속임수를 쓰는 블러핑까지 했다는 뜻이다.

지금 추세대로라면 도박사들의 패색이 짙다. 리브라투스는 매일 인간의 블러핑을 학습하고 있다. 대회에 참가한 프로겜블러 제이슨 레스는 한 언론과 인터뷰에서 “이기기 어렵다. 이미 우린 수렁에 깊게 빠진 상태”라고 말했다.

AI의 승리 소식에 개발자들은 고무됐다. 리브라투스 개발자인 토머스 샌드홀름 교수는 “전세계에서 (격려해주는) 수많은 이메일을 받았다”고 전했다.

리브라투스가 승리하게 되면 AI는 새로운 역사를 쓰게된다. 전쟁이나 사이버전 등 현실 세계의 불확실한 상황에서 AI가 해결사로 나설 수 있기 때문이다.

하지만 인간이 개발한 AI가 인간을 상대로 허세나 속임수를 쓸 수 있다는 점은 인류에 위협일 수 있다.

대회는 30일까지 계속된다. 판돈은 실제 돈이 아니며 우승 상금은 20만 달러다. 리버스 카지노 홈페이지(riverscasino.com/pittsburgh/BrainsVsAI)를 통해 생중계되고 있다.


☞리브라투스란

카네기멜론대학이 개발한 인공지능 프로그램이다. 라틴어로 ‘균형 잡힌(balanced)’이라는 뜻이다. 고정된 전략이 없고 전략을 계산하는 알고리즘만 갖고 있다. 연산 학습 시간은 종전 모델인 클라우디코보다 7배 이상 많은 1500만 시간에 달한다.


정구현 기자 chung.koohyun@koreadaily.com



Log in to Twitter or Facebook account to connect
with the Korea JoongAng Daily
help-image Social comment?
lock icon

To write comments, please log in to one of the accounts.

Standards Board Policy (0/250자)


많이 본 뉴스





실시간 뉴스