믿음의 정도
초장기 게임이론
대학교 IT와 관련된 수업에서 들은 이야기이다.
어느 저명한 연구소인가의 주최로 프로그램 대회를 열었다. 다른 참가자가 만든 프로그램과 경쟁 또는 협력하여 점수를 따고, 그 점수가 높은 순으로 등수를 매겨서 1등에게 상금을 주는 방식의 대회였다.
규칙은 단순했는데, 둘 씩 만난 양측이 모두 서로를 신뢰하면 각 1점을 얻고, 어느 한쪽이 상대를 신뢰하는데, 상대방이 기만을 택하면 기만을 선택한 프로그램이 2점, 신뢰를 선택한 쪽은 -1 점을 얻는다. 양측이 모두 기만을 선택하면 모두 점수를 얻지 못한다. (감점도 없다) 알고리즘은 경기 중에 수정될 수는 없다고 한다.
다양한 프로그램이 참가했다. 모든 경우에 기만을 선택하거나, 신뢰를 선택하는 프로그램도 있었고, 더 복잡한 계산을 해서 판단을 내리는 프로그램도 있었다. 수십줄의 코드로 작성된 프로그램도 있었고, 그보다 좀더 단순한 것도 있었다고 한다.
우승한 프로그램은 단 몇 줄의 코드로 작성되었다.
- 처음 만난 상대는 신뢰한다.
- 두 번 이상 만난 상대의 경우,
- 지난 번 만났을 때, 서로 신뢰했다면, 이번에도 신뢰를 선택
- 지난 번 만났을 때, 상대가 기만을 택하면 이 후 무조건 기만을 선택
이는 게임이론에 근거한 선택이라고 들었다. 일회성의 게임이론이라면 물론 서로 기만을 선택하는 것이 내쉬균형이 된다. 그러나, 게임이 무한하게 반복된다면, 그리고 게임의 상대가 제한되어 있다면 서로를 신뢰하고, 사기꾼을 신뢰하지 않는 것이 균형이 된다. 물론 몇 번이나 신뢰하지 않기로 하는 것은 또 다른 선택의 문제이다. 이러한 전략을 **팃포탯(Tit-for-Tat)**이라 부른다고 들었다.
게임과 현실
하지만 게임과 현실은 몇 가지 중요한 차이가 있다.
- 회색지대: 게임과 달리 현실에서는 믿거나 속이거나 양자택일이 아니다. 단지 믿는다/믿지않는다와 속인다/속이지 않는다 사이에도 수많은 믿음과 기만의 정도가 있다.
- 장단기 복합게임: 장기와 단기 게임이 복합적으로 섞여 있다. 게임의 발생주기도 불규칙적이어서, 누군가와는 오랜 기간 드문드문 만날 수 있고, 어떤 이와는 짧은 시간 여러번의 게임을 연속적으로 진행할 수 있다.
- 모든 만남에서 위에 정의된 것과 같은 게임을 수행하는 것이 아니다. 그리고 게임이 아닌 상황에서 신뢰가 축척되거나, 신뢰를 잃을 수도 있다.
이렇게 차이가 있다보니, 인간 관계에 게임이론의 전략을 그대로 적용할 수는 없겠지만, 그 점을 고려해서 어느정도 참고할 수는 있지 않을까. 예를 들어, 처음 만난 사이에 상대가 기만을 하려고하면, 그 이후로 그 사람을 아예 불신해버리되, 이미 어느정도의 기간 동안 신뢰가 쌓인 상대라면, 그 자본이 바닥나기 전까지 몇 번은 더 믿어볼 수 있을 것이다. 그리고 몇 번 속았더라도 (표현이 속였다는 것이지, 상대가 악의를 가진 것이 아님을 알고 있을 때), 시간이 지나고 나면 다시 한 번 — 마치 처음 만나는 것처럼 — 믿어볼 수 있을 것이라는 생각이 든다.