본문 바로가기

지식창고

[철학자습] 게임이론과 죄수의 딜레마

죄수의 딜레마 출처 : 유튜브 5분뚝딱철학 캡쳐

 

게임이론은 상호 의존적인 의사 결정에 관한 이론이다. 이 이론에서 '게임'이란 각 참가자들(플레이어, 행위자)이 최고의 이익을 취할 수 있는 최선의 전략을 선택하여 최고의 보상을 얻기 위해 벌이는 행위를 말한다. 게임 이론은 모든 참가자들의 자기 이익의 최대화(극대화)를 전제로 한다. 경제학의 기본 이념과 상통하는 응응 수학의 한 분야로, 탄생과 함께 정치학, 경제학, 사회학, 심리학, 인류학, 국제관계학, 컴퓨터과학 등 여러 학문에 큰 영향을 미쳤다.

 

이전에도 특정한 게임에서의 전략 등에 관한 연구는 있었다. 그러나 게임 자체에 대한 이론이라 할 만한 것은 없었다. 게임에 대한 이론을 본격적으로 정립한 것은 폰 노이만이 처음이었다. 폰 노이만의 대표적 연구는 2인 제로섬 게임이었다. 1928년 그는 2인 제로섬 게임에서 두 참가자 모두 자신에게 가장 이로운 전략을 찾을 때, 언제나 둘 모두 자신에게 최적인 전략을 찾을 수 있음을 증명했다. 이를 미내맥스 정리라 한다.

 

게임 이론의 기본 전제 사항은 다음과 같다.

1. 모든 참가자는 합리적으로 결정한다.

2. 모든 참가자는 모든 참가자들이 합리적으로 결정할 것을 안다.

3. 모든 참가자는 모든 참가자들이 합리적으로 결정할 것을 안다는 것을 모든 참가자들이 안다.

4. 이 논리가 재귀적으로 무한히 확장된다.

 

게임이론은 존 내쉬에 의해 한 단계 진화한다. 프린스턴 대학에 다니던 22살 존 내쉬는 "비협조적 게임Non-Cooperative Games)"이라는 놀라운 논문을 발표했다. 이 논문에서 존 내쉬는 그동안 주목받지 않던 '비협조적 게임'에서 제로섬이 아닐 경우에도 참가자의 수와 상관없이 언제나 균형상태가 존재한다는 것을 증명했다. 이 증명에 존 내쉬의 이름을 딴 '내쉬 균형(Nash eauilibrium)이란 명칭이 붙었다. 이 연구는 폰 노이만과 모겐스턴의 연구보다 훨씬 다양한 종류의 게임에 적용할 수 있는 보편적 모델을 제시했다. 이 연구 업적으로 존 내쉬는 1994년 수학자임에도 노벨 경제학상을 공동 수상하였다.

 

게임이론의 대표적 예시는 '죄수의 딜레마'이다. 두 공범 A.B가 각기 다른 방에서 취조받는다고 가정해보자. 체포되기 전 공범은 묵비권을 행사하기로 약속했다. 그러나 취조관은 이들에게 자백을 받아내기 위해 전략을 쓴다. 둘 다 묵비권을 행사하면 1년 혼자 자백하면 석방, 둘다 자백하면 5년, 혼자 묵비권을 행사하면 20년. "최대다수의 최대행복"이라는 공리주의를 적용하면 둘 다 묵비권을 행사하는 것이 최선이다. 그러면 우정, 의리, 약속 모두를 지킬 수 있다. 그러나 나는 약속을 지켜 묵비권을 행사했는데, 상대방이 자신의 이익을 위해 약속을 어기고 자백을 할 때 문제가 된다. 한 번 그런 의심이 들면 독박을 쓰지 않고 무죄를 받기 위해 서로 자백을 하고 그 결과 둘 다 5년 형을 살게 된다. 이것을 죄수의 딜레마라고 한다.

 

게임이론은 자유방임주의에 대한 반론을 제시한다. 애덤 스미스는 "모두가 자신의 이익을 위해 노력하게 하면 자연스럽게 사회는 발전한다"고 주장했고 그의 주장은 오랫동안 진리로 받아들여졌다. 하지만 "죄수의 딜레마"는 개인이 각자의 이익에 충실해 자백을 했는 그것이 두 사람 모두의 이익이 아님을 증명한다. 징역 1년으로 끝낼 수 있었는데, 자신의 이익만 생각하다보니 둘 다 5년 형을 받게 되는 것이다.

 

죄수의 딜레마를 해결하기 위해선 어떻게 해야 할까. 로버트 엑셀로드는 1980년 죄수의 딜레마 전략 리그전을 벌였다. 참가자들이 다른 모든 팀들과 한 번씩 경기를 해서 점수를 합산해 승자를 가리는 방식이었다. 이 경기에는 세계 각국의 수학자, 심리학자, 경제학자들이 만든 16개 전략 프로그램이 참가했다. 우승은 캐나다 수학자 라포포트에게 돌아갔다. 그의 전략은 상대가 협력하면 자신도 협력하고 상대가 배신하면 자신도 배신하는 정의파 전력이었다.

 

엑셀로드는 대회 상위권 전략들의 특성을 이렇게 말했다.

첫 째, 먼저 배반하지 않는다. 이 전략은 처음엔 높은 점수를 얻지만 전체적으로는 손해다.

두 번째, 대인이 되어라. 응징은 확실히 하고 용서도 확실히 하라.

세 번째, 자신의 전략을 노출시켜라. 전략을 숨기거나 속이면 높은 점수를 얻지 못한다.

 

죄수의 딜레마 해법을 인관관계에 그대로 적용한다면 훨씬 좋은 관계를 유지할 수 있지 않을까. 먼저 배신하지 하지 말고 배신에 대해서는 확실히 선을 긋고, 선의에는 그에 걸맞는 보상을 하고, 타인을 속이지 않는다면 원만한 대인관계를 유지할 수 있을 테다. 그러나 딜레마가 괜히 딜레이일까. 인간은 자신의 이익을 우선하고 타인의 마음을 알 수 없기에 '자백'을 하고 마는 딜레마.