http://www.geocities.com/Hollywood/Studio/1541/juegos.html
Esta es la versión guardada en la caché de Pandeo.com de la página : http://www.geocities.com/Hollywood/Studio/1541/juegos.html
La caché de Pandeo es una instantánea de cómo estaba esta página en el momento en el que fué registrada automáticamente por nuestro robot de búsquedas
Es posible que la página haya cambiado desde entonces (o que incluso no exista). Pulse sobre el enlace de la parte superior para ver la versión más actual.

Pandeo.com no tiene relación alguna con los autores de esta página ni es responsable de su contenido.

Rufasto: Teoría de Juegos



Teoría de Juegos

Augusto Rufasto

Descarguen de mi website ¡gratis! el Manual de Teoría de Juegos

Augusto Rufasto
arufast@yahoo.com
Correo interactivo

The board is set, and the pieces are moving.
JRR Tolkien, The Lord of the Rings: The Return of the King


Servicios Infometrics (análisis de información económica) y
Protocolo de Negocios (traducciones de documentos de negocios y comunicación en inglés, francés y español)


Ésta es una buena página sobre la teoría de juegos, y muy consultada: he recibido comentarios muy positivos de diferentes partes del globo por parte de estudiantes, profesores universitarios y consultores de negocios a tal respecto. Me siento satisfecho de ello en general, y de la utilidad de mi manual de teoría de juegos en particular. Quisiera que conozcan también mi website sobre teoría económica (incluye conceptos básicos y mis modelos matemáticos de análisis microeconómico y macroeconómico, de gran ayuda para la comprensión de la estructura y mecánica de los mercados y la economía macro. Revisen los doce capítulos de mi fantástico Libro de Economía, en un website que incluye trabajos muy buenos (míos) centrados en la estructura matemática de la economía. También un glosario, con algunos de los términos más frecuentes en teoría económica. Finalmente, enlaces de fundamentos teóricos de negocios en mi página principal. Y quedan pendientes nuevos archivos y actualizaciones... ¡y me conviene que aumenten sus visitas y vuelvan más denso el tráfico de esta página! Una frase favorita de Milton Friedman (pero acuñada en 1952 por el profesor Alvin Hansen, de Harvard) es There's no such thing as a free lunch. Para pensarla, ¿eh? Mi frase favorita es de la canción Opportunities de los Pet Shop Boys: I've got the brains, you've got the looks, let's make lots of money!

La teoría de juegos es una fascinante aplicación de la matemática pura y la psicología pura, e incorpora series de modelos capaces de simplificar problemas complejos de competencia o interacción incierta entre dos o más agentes, a los que se denomina "juegos". Resultado de la utilización de estos modelos son los criterios de decisión que optimizan la posición de un agente en un juego, e.g., elevan la probabilidad de éxito (disminuyen el riesgo de fracaso) del agente respecto al logro de sus intereses.

Veo a la teoría de juegos dividida en dos grandes compartimientos conceptuales. Por un lado, están las aproximaciones fundamentales a los problemas de juegos; por el otro, están los modelos altamente específicos de análisis de tipos particulares de problemas. En esta revisión me ocupo de estudiar aproximaciones fundamentales. La ventaja de ello es que son las primeras aproximaciones al estudio de los juegos descubren estructuras generales de juegos cuya comprensión es imprescindible para continuar el estudio de los modelos específicos.

Una exclusividad de mis enfoques sobre teoría de juegos es la inclusión en detalle de la optimización para el análisis de juegos suma cero. La aplicación de programación optimizadora para este tipo de juegos no es nueva, pero mi enfoque incorpora ejemplos de resolución de juegos suma cero por Solver de Excel. El desarrollo de este enfoque se encuentra en una etapa inicial (se requiere implementar un programa de Investigación y Desarrollo para una profundización especialmente significativa), por lo que este tipo de análisis puede aún estar limitado por algunas restricciones. Sin embargo, es ilustrativo, didáctico, y rompe con la limitación del cálculo manual para solución de la optimización en juegos de suma cero. Matrices de numerosas filas y columnas que representan juegos de suma cero bipersonales pueden ser tratadas con mis técnicas, produciendo finalmente criterios de decisión-acción para estudiar los resultados probables y las posibilidades de obtener ventaja en un juego de este tipo. Mi enfoque puede ser consultado en el manual, (accesible desde mi página principal). No espere para descargarlo, es gratis...

He desarrollado una carrera académica como profesor en la Pontificia Universidad Católica del Perú durante 10 años y me dedico por propia motivación (y me motivan también los comentarios favorables a tal sentido) a investigar, escribir y divulgar temas científicos y técnicos diversos. Puedo afirmar que el alcance de mis esfuerzos científicos se diferencia de muchos otros por estar orientado a una más sobria simplificación de los enfoques.

Aparte de dedicar una buena porción de mi tiempo a a investigar pro bono et motu proprio, es decir, de estudiar problemas matemáticos, construir mecanismos teóricos, elaborar documentos de investigación y actualizar este modesto website, todo ello en forma gratuita, mi línea de actividad profesional principal (i.e., mi trabajo, ¡a esto me dedico!) es el análisis de información económica y comunicación idiomática de negocios (inglés-francés-español), realizable a través de Internet, a distancia, o personalmente dentro de Chile, o en Mendoza, Argentina. Asesoría económico-financiera y de negocios dirigida en Lima, Perú. También servicios de investigación, y asesoría universitaria pregrado y maestría de todo tipo. Clientes satisfechos por la calidad absoluta en el servicio sólidamente fundada en mis ventajas competitivas exclusivas y mi objetivo de afinar y perfeccionar constantemente técnicas y habilidades de análisis de información económica (análisis econométrico, estadístico, económico, financiero, bursátil, de mercado, etc.) y de traducción e interpretación poli-idiomática.

La calidad de estos servicios es para ustedes. Escríbanme a arufast@yahoo.com o contáctenme al +56-9-136-3160.

Ya lo dijeron los Beatles en 1963: Now gimme money, that's what I want!

Augusto Rufasto

La Teoría de Juegos es un tipo de análisis matemático orientado a predecir cuál será el resultado cierto o el resultado más probable de una disputa entre dos individuos. Fue diseñada y elaborada por el matemático John von Neumann y el economista Oskar Morgenstern en 1939, con el fin de realizar análisis económico de ciertos procesos de negociación. Von Neumann y Morgenstern escribieron el libro The Theory of Games and Economic Behaviour (1944).

A.W. Tucker diseñó el problema conocido como "Dilema del Prisionero".

El matemático John Nash (John F. Nash o John Forbes Nash, Jr., 1928-) creó en 1950 la noción de "equilibrio Nash", que corresponde a una situación en la que dos partes rivales están de acuerdo con determinada situación del juego o negociación, cuya alteración ofrece desventajas a ambas partes.

Otros importantes representantes de la teoría de juegos fueron el húngaro nacionalizado estadounidense John Harsanyi (1920-) y el alemán Reinhard Selten.

Nash, Harsanyi y Selten recibieron el Premio Nobel de Economía de 1994 por sus contribuciones a la teoría de juegos.

Existen diferentes herramientas para analizar un juego, entre ellas:

-La Matriz de Pagos o Pay-Off Matrix
-Las curvas de reacción
-Los árboles de resultados sucesivos

La Matriz de Pagos

Una matriz de pagos es una tabla de doble entrada. Las entradas superiores indican las opciones que puede tomar B, y las entradas de la izquierda muestran las opciones que puede tomar A. Los puntos matriciales definidos por las combinaciones de decisiones representan los posibles resulados del juego, incluyendo las ganancias (o pérdidas) que obtendrá cada jugador. Véase la siguiente matriz de pagos:

B1 B2
A1 10, -10 -8, 8
A2 -12, 12 11, -11

El primer componente de cada par de números es el pago que recibe A si el resultado se ubica en la combinación que define a cada determinado punto matricial. El segundo componente es el pago que recibe B en la misma situación.

Juego suma cero

Un juego suma cero es aquél en que todo lo que gana un jugador A lo pierde un jugador B, y viceversa. De esa manera, si A gana 10 dólares en un negocio, por ejemplo, B gana -10 dólares, es decir que pierde 10 dólares. 10 + (-10) da cero. Un juego suma cero puede tener notación matricial, o no tenerla. La teoría de juegos, por su parte, dedica muchos esfuerzos al análisis de problemas suma cero susceptibles de ser notados matricialmente.

Juego suma no-cero

Representa una situación en que lo que A gane no siempre deberá ser perdido por B, y viceversa. Algunos juegos suma no-cero son susceptibles de tener notación matricial.

Matriz de un juego suma cero

La matriz de juego suma cero siempre ve los pagos desde el punto de vista del jugador cuyas decisiones están representadas horizontalmente. Véase, a modo de ejemplo, la siguiente matriz de pagos:

B1 B2
A1 10 -8
A2 -12 11

La matriz expuesta nos dice que A y B pueden tomar diferentes decisiones. Si A opta por la decisión o camino A1 y B opta por la decisión B1, el juego pagará 10 puntos a A y cobrará esos mismos diez puntos a B. Si A opta por la decisión A2 y B opta por la decisión B1, A pierde 12 puntos y B gana esos mismos 12 puntos. Si A se decide por el camino A1 y B por el camino B2, A pierde 12 puntos y B los gana. Si A toma la decisión A2 y B toma B2, A gana 11 puntos, que son perdidos por B.

Matriz de juego suma no-cero

Por otro lado, una matriz cuyo resultado sea diferente de cero normalmente presenta varios resultados del juego que pueden ser favorables para A y B. Los resultados en una matriz de juego de suma diferente a cero (o suma "no-cero") se exponen usando comas en cada celda para mostrar lo que obtiene el jugador representado en las decisiones horizontales primero (nuestro jugador A) y lo que obtiene el jugador vertical a continuación (nuestro jugador B). Si deseáramos representar un juego de suma cero en juna matriz de juego de suma no-cero, el resultado será el siguiente (basados en nuestro ejemplo):

B1 B2
A1 10, -10 -8, 8
A2 -12, 12 11, -11

En una matriz suma-cero, un resultado "justo" es aquél en que ninguno de los dos individuos rivales obtiene beneficio positivo. Dado que cualquier ganancia de A es una pérdida para B, lo justo se da cuando ninguno gana ni pierde. El resultado de un juego de suma cero no siempre será justo. Por ejemplo, en un juego de ajedrez o de damas, el resultado a veces es el empate ("tablas" en ajedrez). Tal es un resultado "justo" desde el punto de vista social. Pero la mayor parte de las veces, el resultado no es el empate, sino que aparece un único ganador. El ajedrez, siendo un juego suma cero, muestra que el resultado óptimo no siempre será lo socialmente justo. El siguiente juego tiene un resultado justo en la combinación decisional A2-B1, es decir en la combinación 2-1

B1 B2
A1 10 -5
A2 0 6

En una matriz de suma diferente a cero, el resultado justo será aquél que beneficia simultáneamente a ambos, o que beneficia a uno lo más posible, afectando al otro lo menos posible. Una matriz de suma diferente a cero asigna dos valores positivos a cada punto matricial.

Curvas de reacción

En la teoría de juegos, las curvas de reacción muestran, en un gráfico cartesiano, las combinaciones de decisiones (puede ser en las abscisas) y pagos (puede ser en las ordenadas). Un ejemplo sencillo de curvas de reacción puede verse en las curvas de oferta y demanda. Supóngase que demanda y oferta son construídas por tanteo, según propuestas de precios a cobrar y pagar realizadas por un ofertante y un demandante en relación a una cantidad determinada a negociarse en el mercado. Las combinaciones (X*, pd) ofrecidas y las combinaciones (X*, pd) propuestas por el demandante determinarán que exista una diferencia de precios (pd - ps) mayor, menor o igual a cero. Si la diferencia es mayor que cero, el demandante debe decidir si le conviene proponer un nivel de negocios diferente combinado con un precio a pagar inferior. El ofertante debe, asimismo, decidir si propondrá un nivel de negocios diferente combinado con un precio a pagar superior. El procedimiento es similar cuando la diferencia es menor que cero: el ofertante quizás proponga un precio menor y el demandante quizás proponga un precio mayor. En el caso descrito por los mercados que siguen la ley de la oferta y la ley de la demanda, se demuestra que existe una combinación solución (X, p) que presenta convergencia y estabilidad.

En este modelo de mercado, se realiza un secuencia de movimientos, tomando como "señal" a la diferencia de precios. Los turnos son dobles, es decir que los dos jugadores actúan simultáneamente. Otro modelo notable de tipo secuencial es el duopolio de Cournot.

Árboles de resultados sucesivos

Un diagrama de árbol de resultados sucesivos se utiliza en juegos que implican secuencias de movimientos (un movimiento es un binomio decisión-acción). En este árbol, se define un punto de partida (por ejemplo, la posición inicial del jugador A). A partir del inicio, se extienden ramas que representan los diferentes movimientos que puede realizar el jugador que inicia la competencia. Los diferentes movimientos o ramas definirán igual número de resultados o pagos, que pueden servir como punto de partida para nuevas decisiones del jugador siguiente (por ejemplo, el jugador B). El proceso se repite hasta completar el número de movimientos que A y B pueden realizar. Un juego con un movimiento para A y uno para B posee dos generaciones de ramas. Un juego con dos movimientos para A y dos movimientos para B posee cuatro generaciones de ramas. En general, un juego con movimientos para A y n movimientos para B (el valor absoluto de m-n no puede ser mayor que 1) tiene m+n generaciones de ramas. Las puntas de las ramas de última generación contienen la descripción de los posibles resultados del juego. En el caso particular de que tanto A como B pueda tomar sólo dos decisiones en cada estadio del juego, el número de puntas del árbol será 2m+n.

Orden de los movimientos en el juego

Un juego puede ser de movimientos simultáneos o de movimientos secuenciales. El popular juego de "piedra-papel-tijera" es un juego simultáneo, mientras que las damas y el ajedrez son juegos secuenciales. El duopolio de Cournot también es un juego secuencial. Cada uno de estos tipos de juego presenta diferentes focos de interés para la teoría de juegos.

El juego simultáneo más notable es el llamado "dilema del prisionero". Este "dilema" es un juego suma no-cero. En este interesante caso, el dilema de cada uno de dos prisioneros consiste en no delatar a su compañero o delatarlo. La reducción del tiempo de encarcelamiento es un pago. Una reducción negativa corresponde al incremento de la pena de encarcelamiento. Los interrogadores se acercan a cada uno de los dos reos supuestamente implicados en un crimen realizado en conjunto. A cada reo se le dice lo siguiente:

"el período de encarcelamiento preventivo es de tres meses, de manera que si podemos probar que tu compañero cometió el crimen y tú no, se te reducirá la pena en tres meses y saldrás libre al instante y a él se le incrementará la pena en tres meses, saliendo en seis meses. Pero si probamos que tú y tu compañero son criminales, el período de encarcelamiento será de cinco meses, incrementándose en dos meses (reduciéndose en menos dos meses). Finalmente, si no podemos probar que tú y tu compañero son culpables, la reducción de la pena será de dos meses, con lo que ambos deberán pasar un mes en la sombra, mientras se realiza una serie de trámites"

Un pago en este caso es el tiempo en que se reduce la pena. Los aumentos de pena son reducciones de signo negativo. La matriz de pagos correspondiente es la siguiente:

B1 B2
A1 -2, -2 3, -3
A2 -3, 3 2, 2

¿Cuál será la solución de este juego? Se ve que si A y B cooperan, es decir que ninguno delata al otro, se obtiene reducción de la pena en dos meses para cada uno (resultado 2, 2). Si A desea salir al instante, puede tentar suerte con la reducción de tres meses, buscando el resultado 3, -3. Para ello, A deberá delatar. B puede tentar suerte con el resultado -3, 3, debiendo también delatar. Si A y B optan por la delación, en lugar de obtener la salida instantánea, se hacen ambos acreedores a un incremento de la pena de dos meses (es decir, reducciones de -2, -2).

Para resolver el problema será necesario analizar la posición de cualquier jugador (por ejemplo, A). A puede optar inicialmente por no delatar. Si B supusiera que A no lo va a delatar, concluirá que su reducción de pena será de dos meses o de tres meses. Bajo la hipótesis de que A no lo delatará, B se sentirá compelido a delatarlo, ya que de esa manera el resultado obtenido es máximo. El análisis que parte de la posición de B lleva a conclusiones paralelas en la estrategia de A. La búsqueda imperativa de la mejor posición final posible los lleva a optar por la estrategia de delación.

Resultado de un juego por análisis de una matriz de pagos

Los resultados se obtienen por criterios de convergenca y de estabilidad. La convergencia se produce cuando las decisiones de A y B tienden a generar un resultado favorable para ambos. Una combinación de decisiones que sea atractiva para B y no moleste a A permitirá que ambos obtengan beneficios del juego. Igualmente, una decisión que favorezca a A y no moleste a B dará beneficios a ambos. El análisis en la matriz de pagos muestra que muchas veces los caminos elegidos por A y los caminos elegidos por B convergen a un punto. Podría decirse que en ese caso "los caminos de A y de B llevan a Roma". La convergencia de los caminos, como en el caso de los verdaderos caminos seguidos en una región cualquiera, se produce en un punto determinado. A tal punto se le llama el óptimo colectivo del juego.

La convergencia con frecuencia produce una solución estable. Una solución estable corresponde a una decisión que no se cambiará en el futuro. Supongamos que A decidió realizar una acción A1 y que B decidió realizar una acción B1. Una vez que ambos han llegado a esta decisión óptima, es posible que se sientan satifechos con la solución. En tal caso, se dice que el punto solución es estable (un punto solución viene definido por dos acciones cualesquiera, una de un sujeto A y otra de un sujeto B, tal que dicho punto ofrece beneficios significativos a ambos sujetos o jugadores). A un punto estable se le puede considerar como un sumidero o atractor. Es un sumidero porque recuerda el punto en que el agua abandona un tanque, ocurriendo que todos los vectores del agua se dirigen hacia ese punto de escape. Es un atractor porque, si se considera a toda la matriz de pagos como una región espacial cubierta de puntos, el punto estable atrae a todos esos puntos. El concepto de estabilidad suele derivar en el concepto del equilibrio Nash.

Equilibrio Nash

Dada una situación cualquiera definida por una elección de A y una elección de B, si ocurre que A supone que B no modificará su elección y opta por no modificar la suya propia y, simultáneamente, B supone que A no modificará su elección y opta también por no modificar la suya, se dice que tal situación es un equilibrio Nash. Como se ve, el equilibrio Nash es una situación que presenta ventajas para los dos jugadores, y en razón de tales ventajas, ni A ni B cambiarán de decisión.

Sin embargo, puede ocurrir que A observe que puede ganar un poco más de beneficios si defrauda a B. Tal sería el caso de un punto solución inestable. Como la matriz de pagos se analiza en dos dimensiones, la convergencia es la que da la atracción. Se ve que la atracción no siempre da estabilidad. La atracción ejercida por las decisiones de A y B convierte a este punto en una solución, mientras que la repulsión ejercida por ellas lo convierte en un punto inestable. Defraudar a B significa aprovechar la posición del óptimo social para elevar aún más los beneficios obtenibles del juego. Por ejemplo, si A y B decidieron las siguientes acciones: A1: A no venderá mercadería en la zona C. B1: B no venderá mercadería en la zona C. (C resulta ser un área neutral). Si, finalmente, A decide vender mercadería en la zona C porque encuentra que puede lograr beneficios mayores, defraudará a B. B, al ver eso, decidirá que de nada sirve respetar la regla infringida por A. A y B poseían como resultado social óptimo una distribución equitativa de las regiones de venta. Ahora, A y B perderán esa posición social óptima como resultado de haber buscado cada uno su ventaja individual.

La cuestión de la convergencia y de la estabilidad caracteriza tanto a los problemas llamados juegos suma cero (en los cuales la matriz de pagos es de suma cero) como a los juegos de suma distinta a cero.

Equilibrio Nash: Aplicación a la Competencia de Dos Empresas

Juego suma-cero con decisiones inciertas

Cuando no puede encontrase una solución estable, la solución puede aparecer por análisis estadístico. Se entiende que la probabilidad de que A tome la decisión A5 no es del 100%. La probabilidad de que B tome B7 tampoco es del 100%. En tal caso, un estudio acerca de la probabilidad de que cada decisión sea tomada será el que defina la cuestión. La desventaja de este enfoque es que no siempre se podrá disponer de un estudio previo de la probabilidad de decisión de los rivales.

Un enfoque alternativo es el del análisis de riesgo mínimo. Este enfoque asume que los rivales A y B actuarán desendo minimizar el riesgo de perder. En este caso no se requiere un estudio de las probabilidades, sino un estudio de optimización estocástica. La solución del problema de optimización estocástica da la idea de qué camino debe ser elegido con la mayor frecuencia, en orden de reducir el riesgo de pérdida. Este enfoque de riesgo mínimo es analizado comúnmente por medio de programación lineal. Este enfoque será discutido más adelante.

El valor de un juego

El valor de un juego es la combinación de ganancias o pérdidas que da el juego a ambos jugadores, A y B. Como se sabe, si el juego es suma cero, lo que gana A lo pierde B y viceversa. En estos casos, se denota el valor del juego como la ganancia o pérdida que da éste, una vez resuelto, a A (que equivale a la pérdida o ganancia que obtiene B).

Cuando el juego es suma no-cero, se denota el valor del juego como la combinación de las ganancias que el juego da, una vez resuelto, a A y B.

El concepto del juego socialmente justo

Este concepto se aplica a los juegos suma cero. Un juego suma cero es justo si su valor es cero. Que el valor sea cero implica que tanto A como B obtienen ganancia nula.

Análisis de la dominancia de opciones

Véase el siguiente juego suma-cero:

B1 B2
A1 0 3
A2 -4 9

La dominancia de estrategias puede ayudar a resolver este tipo de juego. La dominancia de estrategias consiste en identificar qué opciones dominan a otras y qué opciones son dominadas por otras. En el caso de A, vemos que decidirse por la opción 1 puede darle como resultado la ganancia nula o un puntaje de tres. Si se decide por 2, puede ganar 9 o perder 4. La posición de A tiene un valor, pero para que dicho valor sea estimable es necesario conocer la probabilidad con la que B tomará cualquiera de sus opciones. Sin el conocimiento de esa probabilidad, no puede saberse si la opción A1 domina a la opción A2, o viceversa.

El caso de B es diferente. B siempre decidirá tomar la opción 1, ya que prefiere no perder nada a perder 3 puntos, y prefiere ganar 4 puntos a perder 9. La opción B1 domina a la opción B2. Puede decirse también que la opción B2 está dominada por la opción B1. La probabilidad de que B decida 1 es 100% y la probabilidad de que decida 2 es 0%.

El análisis de la dominancia de opciones sirve para reescribir el juego, eliminando siempre las opciones dominadas. El juego se transforma en:

B1
A1 0
A2 -4

Tanto B como A son conscientes de esta situación. Dado que la situación se ha simplificado, A puede ver las cosas con más claridad, y realizar un nuevo análisis de la dominancia de sus opciones. Naturalmente, sabiendo que B decidirá definitivamente B1, a A no le queda más remedio que optar por A1, que es la estrategia que domina a la otra. El juego se transforma en:

B1
A1 0

Por lo que la solución del juego es A1-B1, y el resultado del juego es la ganancia nula para ambos jugadores. Este juego es socialmente justo.

En realidad, son pocos los juegos que pueden ser resueltos mediante el análisis de dominancia. El procedimiento de análisis de dominancia suele tener aplicación limitada, es un mecanismo de "simplificación" de problemas. Son muchos los problemas que, sometidos al análisis de dominancia, no pueden ser simplificados. Véase el siguiente ejemplo:

B1 B2
A1 0 2
A2 3 0

En este caso, ni B ni A tienen estrategias dominadas o dominantes. Necesariamente deben ahora leer análisis probabilístico en la teoría de juegos.

Juegos matriciales suma no-cero notables


Regresar a la página principal de DAS GELD!


This page hosted by
Get your own Free Home Page
1