John Nash y la complejización de la teoría de juegos

Juegos

Podríamos decir que Max Weber es el primer autor que construyó de manera sistemática una teoría de la acción social y por tanto de un modelo que explica la elección racional de los sujetos dentro de un entorno sociocultural dado, su propuesta teórica influenció de manera directa a diversas tradiciones de investigación en sociología, economía y ciencia política. Es decir, Max Weber es el parteaguas para entender modelos y conceptos como: el de acción en la fenomenología de Alfred Schütz, el comportamiento basado en reglas en la sociología del lenguaje de Peter Winch, el funcional-estructuralismo de Talcott Parsons con la noción de acto unidad como parte fundamental de los sistemas sociales, el realismo político y el decisionismo de Carl Schmitt, la noción de “otro generalizado” en el pragmatismo de G. H. Meade y la Escuela de Chicago, la noción de racionalidad instrumental en la Escuela de Frankfurt y posteriormente en Jürgen Habermas y, por supuesto en las teorías de la acción racional y las teorías de juegos (rational choice) de John Von Neumann y por supuesto de Nash.

Para explicarlo de manera simple, Weber supone que es posible explicar científicamente lo social a través de la observación y la interpretación hermenéutica de la acción social individual, es decir, propone un punto de partida distinto a los que se habían formado hasta esos momentos, los cuales buscaban explicar lo social a través de la observación de las estructuras sedimentadas a lo largo del espacio y el tiempo, y que de alguna forma afectan y determinan a los sujetos en su comportamiento en sociedad, véanse los modelos construidos por Marx y Durkheim. Esto no quiere decir que Weber niegue la conformación estructural de la sociedad, simplemente es tomada en cuenta como contexto socio-cultural de las acciones sociales, para decirlo de forma más específica, los plexos de acciones se encuentran insertos en un contexto sociocultural, de tal forma que las motivaciones y los cálculos aunque son implementados y operativizados de manera subjetiva,  no serían posibles sin procesos de socialización complejos, que incluyen por supuesto la intervención de estructuras sociales.

La acción, en ese sentido, es observable a través de procesos de tipificación analítica, es decir que no observamos las acciones “en sí”, sino que lo hacemos a través de modelos teóricos abstractos que nos permiten interpretar y explicar dichas acciones en términos de sus motivaciones, efectos, medios y fines utilizados, así como en sus consecuencias deseadas y no deseadas en términos su interrelación con otras cadenas de acción insertas en un contexto socio-cultural. En esa línea, Weber nos provee de una tipificación ideal de los principales tipos de acción, en donde encontramos en primer lugar a la acción con arreglo a fines; en segundo lugar la acción con arreglo a valores; en tercer lugar la acción con arreglo a tradiciones; y por último la acción afectiva.

La acción racional con arreglo a fines o racionalidad instrumental es el tipo de acción más prominente en la modernidad y esta basada en el cálculo costo beneficio en donde se presupone que los sujetos actúan proyectando la obtención de ciertos fines, utilizando y calculando los medios más adecuados para lograrlo. Este tipo de racionalidad nos sirve para interpretar y explicar acciones relacionadas tanto a cuestiones sociales, políticas y  económicas, como a cuestiones científicas y tecnológicas, esto debido a que todo sujeto, independientemente del contexto puede actuar con base en dicho presupuestos de cálculo instrumental.

La tradición de la elección racional y la teoría de juegos toman este punto de partida con el fin de construir modelos analíticos de acción que busquen no solo explicar sino también optimizar escenarios de acción instrumental relacionados a las consecuencias deseadas y no deseadas en ámbitos como la política y la economía. En ese sentido, han surgido distintos enfoques que buscan explicar y predecir ciertos comportamientos asociados a una serie de cadenas de acciones sociales en términos de la observación de los costos, los beneficios y las consecuencias resultantes de dichos plexos de acción, asimismo se observan las formas en que se puede ganar o perder dependiendo de la estrategia utilizada en el modelo o juego.

Los primeros desarrollos de teoría de juegos, como los formulados por Von Neumann y Oskar Morgenstern , apuntan a construir juegos de “suma cero”, para explicarlo de manera muy simple, el juego plantea la interacción de dos o más sujetos, aquí, el ganador obtiene todos los puntos o beneficios, dejando a los otros con las pérdidas, piénsese en juegos como el ajedrez o el póker. Estos juegos son de tipo “no cooperativo” y son llamados de “suma cero” debido a que el ganador gana lo mismo que pierde el oponente; pero, para Von Neumann, independientemente del número de jugadores, siempre va a haber un juego suma cero que involucre dos personas, esto quiere decir que en un conjunto en el que interactúan una serie de acciones racionales que operan bajo reglas preestablecidas siempre habrá alguien que resulte ganador y alguien que resulte perdedor en los términos antes mencionados.

Por mucho tiempo, este tipo de juegos sirvió para explicar las teorías económicas que van desde Smith y Ricardo, pasando por Marx, hasta llegar a la economía neoclásica. Si observamos detenidamente, dichas tradiciones pensaban el intercambio y las decisiones económicas basados en modelos de suma cero, en el sentido de que siempre hay un perdedor, o para decirlo de otra forma, el ganador siempre le quita algo a algún jugador, pensemos en el principio de plusvalor en Marx, el cual no es otra cosa que un juego de suma cero, Marx plantea que el capitalista retiene el valor agregado de las mercancías trabajadas por el proletario generando así trabajo no retribuido que funciona para reproducir y acrecentar el capital dentro del sistema; como podemos ver, la reproducción del capital por medio de la retención del trabajo no retribuido es para Marx un proceso en el cual el capitalista gana algo quitándoselo a otra persona, en este caso al proletario, en síntesis, podríamos decir que el modelo económico propuesto por Marx responde a una visión de juegos de “suma cero”.

John Nash, por su parte, formuló un modelo teórico analítico que buscó superar a los juegos de “suma cero” a través de la búsqueda de un equilibrio entre los jugadores a partir de la observación de las estrategias individuales de cada jugador para posteriormente analizar el entorno general, es decir mediante  la formulación de juegos “cooperativos”. Ahí, se presupone que los jugadores utilizarán la estrategia que crean que es más adecuada para maximizar sus beneficios, pero, dicha estrategia no será cambiada si los otros jugadores no cambian la suya, para decirlo de forma más específica, cada jugador no solo tiene una estrategia, sino también supone cuál puede ser la estrategia seguida por sus competidores, por tanto, todos sus cálculos y acciones son resultado de dichas presuposiciones.

Como podemos ver, Nash vuelve el juego mucho más complejo, debido a que ahora habría que observar ya no en función de ganadores y perdedores, sino en términos de la intersubjetividad de los jugadores, en donde cada jugador presupone y calcula cuál será la estrategia de los otros jugadores y con base en eso elabora su propia estrategia con la finalidad de maximizar sus beneficios. El equilibrio surge cuando a partir de estos presupuestos los jugadores no cambian su estrategia, ya que por una parte no existe un incentivo para que eso suceda, y, por otra parte porque se encuentran utilizando la mejor estrategia posible para obtener alguna ganancia. Pero, hay que aclarar que este equilibrio no supone que cada jugador obtenga el mejor resultado o que conjuntamente obtengan beneficios, simplemente plantea que cada jugador al mismo tiempo gana o pierde algo según sea su estrategia y, eso se determina observando individualmente a cada participante.

El gran ejemplo de este tipo de juego es a través del famoso juego “el dilema del prisionero modificado” el cual plantea que dos prisioneros encerrados en dos celdas distintas, en donde se les ofrece el mismo trato por parte de las autoridades, el cual señala que si ambos jugadores confiesan el asesinato, ambos irán a la cárcel con una pena de 10 años; si uno de ellos se queda callado, este enfrentará prisión perpetua y el otro prisionero saldrá libre; y si ambos se quedan callados, los dos enfrentarían una pena menor de un año.

Dicho problema tiene una sola solución y esta es que ambos confiesen el crimen, ya que, podríamos decir que en términos de racionalidad instrumental, el mayor beneficio individual sería esperar que el otro jugador se quedara callado y por tanto confesara el crimen, ya que la ganancia máxima esperada sería salir libre por el silencio del otro; ahora, guardar silencio sería una estrategia de alto riesgo ya que el otro jugador podría confesar y salir libre y el otro enfrentar una pena de prisión perpetua. En síntesis el equilibrio de Nash se da en la confesión de ambos, ya que no solo se obtiene una igualdad de circunstancias si el otro prisionero confiesa, sino que en el caso de que el otro jugador guarde silencio se obtiene una mayor recompensa, contrariamente a guardar silencio en donde el riesgo de perder es muy alto. 

Como podemos ver, a través de este juego es posible explicar de manera compleja la interrelación de distintas acciones instrumentales en términos de las estrategias usadas por cada uno de los actores. Para decirlo de otra forma, mediante este modelo es posible observar la doble contingencia (Parsons) presente en toda interacción social, esto quiere decir que un sujeto A tiene expectativas de conducta y acción sobre otro sujeto B basados en criterios normativos y axiológicos provenientes del sistema social, lo mismo por parte de B hacia A, estas expectativas de acción sirven como marco de referencia para la generación de estrategias de acción que maximicen los rendimientos y las ganancias de los sujetos. Como podemos ver, pensar lo social en términos de juegos “suma cero” reduce a sobremanera cualquier análisis, como pudimos ver, no hay ni ganadores ni perdedores, hay ganancias y pérdidas simultáneas por parte de todos los jugadores; de tal manera lo que habría que observar en términos de las acciones con arreglo a fines, no es las acciones aisladas, sino las cadenas de acción insertas en un contexto social contingente que genera cierto tipo de expectativas.

Véase: The Economist

Publicidad