¿Qué es la teoría de juegos?

Imagen: Plumas Atómicas

¿Qué pensarías si te dijeran que las matemáticas pueden explicar por qué prefieres usar bicicleta a usar un coche, o por qué vives en una colonia y no en otra? No se trata solo de modelos de estadística. Las matemáticas sirven ampliamente para escudriñar en nuestras decisiones personales.

A cualquiera le podrían dar escalofríos admitir que nuestras decisiones son objeto de estudios matemáticos. Pero, lo creas o no, las matemáticas son desde hace tiempo una herramienta de la mercadotecnia y en la ingeniería económica. Y se usan porque funcionan. Detrás de estas herramientas está la teoría de juegos y aquí te explicaremos qué es y cómo funcionan.   

Pero antes de entrar en detalles, una pregunta: ¿la vida es como un juego de ajedrez o como un piedra papel o tijera? O visto de otro modo: ¿La economía mundial o la elección de un medio de transporte como otro pueden entenderse como juegos de mesa?

Preguntas como esta han hecho que sociólogos y matemáticos discutan airadamente desde hace más de cien años. Max Weber fue el primer sociólogo que propuso, de forma sistemática, una teoría de la acción social y por tanto de un modelo que explica la elección racional de los sujetos dentro de un entorno sociocultural dado. Su propuesta influyó enormemente en sociología, economía y ciencia política. Weber fue un parteaguas para entender modelos y conceptos como el de acción instrumental (un cálculo donde se usan equis medios para obtener equis fines), y este concepto es una piedra toral en la teoría de juegos (rational choice) de John Von Neumann y por supuesto de Nash.

Sin negar la conformación estructural de la sociedad, Weber supone que es posible explicar científicamente lo social a través de las decisiones de un individuo, a diferencia de Marx y Durkheim, cuyas teoría se cimentan en la observación de estructuras sociales. Mientras que para Marx el mundo es un juego de ajedrez, para Weber este mismo juego tiene un matiz; para Marx el juego viene predeterminado por las reglas y Weber se enfoca en las decisiones del jugador.

La acción, en ese sentido, es observable a través de procesos de tipificación analítica; es decir que no observamos las acciones “en sí”, sino que lo hacemos a través de interpretaciones. Interpretaciones que toman en cuenta nuestras motivaciones, consecuencias, contextos socioculturales. Para Marx no juegan los individuos, mientras que Weber pone el acento en el papel de los individuos.

En esa línea, Weber nos provee de una tipificación ideal de los principales tipos de acción, en donde encontramos en primer lugar a la acción con arreglo a fines; en segundo lugar la acción con arreglo a valores; en tercer lugar la acción con arreglo a tradiciones; y por último la acción afectiva. Detrás de una sola decisión, hay tradiciones, valores y cálculos costo beneficios. Esto es muy semejante a elegir un coche: habrá quien elija uno por el estatus o porque su padre elegía la misma marca; habrá un tercero que elija el que menos gasolina gaste.

Imagen: Especial

La racionalidad instrumental es el tipo de acción más prominente en la modernidad y está basada en el cálculo costo-beneficio, donde se presupone que los sujetos actúan proyectando la obtención de ciertos fines, utilizando y calculando los medios más adecuados para lograrlo. En teoría, basamos nuestras decisiones pensando en los beneficios que obtendremos.

Este tipo de racionalidad nos sirve para interpretar y explicar acciones relacionadas tanto a cuestiones sociales, políticas y económicas, como a cuestiones científicas y tecnológicas, esto debido a que todo sujeto, independientemente del contexto puede actuar con base en dicho presupuestos de cálculo instrumental.

La tradición de la elección racional y la teoría de juegos toman este punto de partida con el fin de construir modelos analíticos de acción que busquen no solo explicar sino también optimizar escenarios de acción instrumental relacionados a las consecuencias deseadas y no deseadas en ámbitos como la política y la economía. Así es: las matemáticas se volvieron indispensables en terrenos donde creíamos que solo intervenía el azar. De pronto, un algoritmo pudo ser empleado para pronosticar una caída en la industria automotriz o un conflicto geopolítico.

Imagen: Especial

Los primeros desarrollos de teoría de juegos, como los formulados por Von Neumann y Oskar Morgenstern, apuntan a construir juegos de “suma cero”. Básicamente, en un juego suma cero, lo que gana alguien es lo mismo que pierde alguien más. Así es el ajedrez, así es el póker, así es el futbol americano.

Por mucho tiempo, este tipo de juegos sirvió para explicar las teorías económicas que van desde Smith y Ricardo, pasando por Marx, hasta llegar a la economía neoclásica. Lo que ganaba un país, lo perdía otro; lo que ganaba una empresa, lo perdía otra; lo que ganaba un empresario, lo perdía el trabajador.

El problema es que el mundo, por ejemplo la geopolítica, podría parecer una partida de Risk o un partido de futbol, pero es más como una partida de piedra papel o tijera. Hay más de una decisión posible y lo que uno gana no es estrictamente lo que pierde el otro. ¿De qué depende esta diferencia? De cómo interactúan y “cooperan” los participantes sin ponerse de acuerdo, como en un chinchampú o un disparejo.

John Nash, por su parte, formuló un modelo teórico analítico que buscó superar a los juegos de “suma cero” a través de la búsqueda de un equilibrio entre los jugadores a partir de la observación de las estrategias individuales de cada jugador para posteriormente analizar el entorno general, es decir mediante  la formulación de juegos “cooperativos”.

Ahí, se presupone que los jugadores utilizarán la estrategia que crean que es más adecuada para maximizar sus beneficios, pero, dicha estrategia no será cambiada si los otros jugadores no cambian la suya. Cada jugador no solo tiene una estrategia, sino también supone cuál puede ser la estrategia seguida por sus competidores, por tanto, todos sus cálculos y acciones son resultado de dichas presuposiciones.

Como podemos ver, Nash vuelve el juego mucho más complejo, debido a que ahora habría que observar ya no en función de ganadores y perdedores, sino en términos de la intersubjetividad de los jugadores, en donde cada jugador presupone y calcula cuál será la estrategia de los otros jugadores y con base en eso elabora su propia estrategia con la finalidad de maximizar sus beneficios.

El equilibrio surge cuando a partir de estos presupuestos los jugadores no cambian su estrategia, ya que por una parte no existe un incentivo para que eso suceda, y, por otra parte porque se encuentran utilizando la mejor estrategia posible para obtener alguna ganancia. Este equilibrio no supone que cada jugador obtenga el mejor resultado o que conjuntamente obtengan beneficios, simplemente plantea que cada jugador al mismo tiempo gana o pierde algo según sea su estrategia y, eso se determina observando individualmente a cada participante.

Imagen: Especial

El gran ejemplo de este tipo de juego es a través del famoso juego “el dilema del prisionero modificado” el cual plantea que dos prisioneros encerrados en dos celdas distintas, en donde se les ofrece el mismo trato por parte de las autoridades, el cual señala que si ambos jugadores confiesan el asesinato, ambos irán a la cárcel con una pena de 10 años; si uno de ellos se queda callado, este enfrentará prisión perpetua y el otro prisionero saldrá libre; y si ambos se quedan callados, los dos enfrentarían una pena menor de un año.

Dicho problema tiene una sola solución y esta es que ambos confiesen el crimen, ya que, podríamos decir que en términos de racionalidad instrumental, el mayor beneficio individual sería esperar que el otro jugador se quedara callado y por tanto confesara el crimen, ya que la ganancia máxima esperada sería salir libre por el silencio del otro; ahora, guardar silencio sería una estrategia de alto riesgo ya que el otro jugador podría confesar y salir libre y el otro enfrentar una pena de prisión perpetua. El equilibrio de Nash se da en la confesión de ambos, ya que no solo se obtiene una igualdad de circunstancias si el otro prisionero confiesa, sino que en el caso de que el otro jugador guarde silencio se obtiene una mayor recompensa, contrariamente a guardar silencio en donde el riesgo de perder es muy alto.

Para Nash, el mundo es un juego en el que es imposible solo ganar o solo perder: siempre hay un intercambio. Esto de hecho es una buena noticia: implica que debemos negociar continuamente, entre las personas como entre las naciones. Toda ganancia implica una pérdida. Esto es visible incluso en nuestras relaciones personales: te enamoras (ganas), pero ves menos a algunos amigos (pierdes); tienes un hijo (ganas), pero acaso ya no tengas tanto dinero (pierdes).

Pero a nivel sociedad, la visión de Nash subraya que no somos islas solitarias y que no puedes solo rascarte con tus propias uñas: debes cooperar activamente y negociar todo el tiempo, así sea en política o en economía. Un gran ejemplo de esto es la industria petrolera en donde los países productores juegan con la producción con la finalidad de influir en los precios internacionales.

Como podemos ver, a través de este juego es posible explicar de manera compleja la interrelación de distintas acciones instrumentales en términos de las estrategias usadas por cada uno de los actores.

Pensar lo social en términos de juegos “suma cero” reduce a sobremanera cualquier análisis. En el mundo no hay ni ganadores ni perdedores, hay ganancias y pérdidas simultáneas por parte de todos los jugadores; de tal manera lo que habría que observar en términos de las acciones con arreglo a fines, no es las acciones aisladas, sino las cadenas de acción insertas en un contexto social contingente que genera cierto tipo de expectativas.

Bibliografía:

Nash, John, Non-cooperative games, Annals of Mathematics, Vol. 54, No. 2, 1951.

Von Neumann, John; Morgenstern, Theory of games and Economic behavior, Princeton University, Princeton, 1944.

Weber, Max, Economía y Sociedad, FCE, México, 2014.