Théorie des jeux évolutionniste (Evolutionary game theory)

La théorie des jeux évolutionnistes ( EGT ) est l'application de la théorie des jeux à des populations en évolution en biologie. Il définit un cadre de concours, de stratégies et…

Théorie évolutionnaire des jeux (EGT) applique les principes de la théorie des jeux aux populations biologiques en évolution. Ce cadre théorique modélise la compétition darwinienne à travers l'analyse des compétitions et des stratégies. Sa création en 1973 a impliqué John Maynard Smith et George R. Price, qui ont formalisé les compétitions comme des interactions stratégiques et établi des critères mathématiques pour prédire les résultats entre les stratégies concurrentes.

La théorie évolutionniste des jeux se distingue de la théorie des jeux classique en mettant l'accent sur l'évolution dynamique des stratégies. Ces dynamiques sont fortement influencées par la prévalence de diverses stratégies concurrentes au sein d'une population donnée.

La théorie évolutionniste des jeux a fourni des informations cruciales sur les fondements évolutifs des comportements altruistes dans un contexte darwinien. Par conséquent, il a suscité une attention considérable de la part des chercheurs de diverses disciplines, notamment l'économie, la sociologie, l'anthropologie et la philosophie.

Historique

Théorie des jeux classique

La théorie classique des jeux non coopératifs a été développée par John von Neumann dans le but d'identifier des stratégies optimales dans les compétitions contradictoires. De tels concours impliquent des participants, chacun possédant une gamme d'actions disponibles. Ces jeux peuvent consister en une seule interaction ou se dérouler en plusieurs tours répétitifs. La séquence d'actions choisie par un joueur définit sa stratégie. Les résultats sont déterminés par des règles établies régissant les actions des joueurs, produisant des gains spécifiques ; ces règles et leurs gains associés sont généralement représentés à l'aide d'arbres de décision ou de matrices de gains. Un principe fondamental de la théorie classique est que les joueurs agissent de manière rationnelle. Par conséquent, chaque joueur doit anticiper et tenir compte des considérations stratégiques de ses adversaires lors de la formulation de ses propres décisions.

Le problème du comportement ritualisé

La théorie des jeux évolutionnistes est née du défi consistant à élucider les comportements animaux ritualisés pendant un conflit, en abordant spécifiquement la conduite « gentleman » apparente observée dans les concours de ressources. D'éminents éthologues Niko Tinbergen et Konrad Lorenz ont avancé que ces comportements servaient le bénéfice collectif de l'espèce. Cependant, John Maynard Smith a jugé cette explication incompatible avec les principes darwiniens, qui mettent l'accent sur la sélection au niveau individuel, récompensant l'intérêt personnel plutôt que les actions bénéficiant au bien commun. Maynard Smith, un biologiste mathématicien, a ensuite adopté la théorie des jeux, suite à une suggestion de George Price, malgré les tentatives infructueuses de Richard Lewontin pour appliquer la théorie.

Adapter la théorie des jeux aux jeux évolutifs

Maynard Smith a reconnu qu'une adaptation évolutive de la théorie des jeux évitait l'exigence de joueurs rationnels, nécessitant simplement l'existence d'une stratégie. Les résultats du jeu révèlent l’efficacité d’une stratégie donnée, reflétant la manière dont l’évolution évalue les stratégies alternatives en fonction de leur capacité de survie et de reproduction. Dans un contexte biologique, les stratégies sont conceptualisées comme des traits génétiquement hérités qui régissent le comportement d'un individu, à l'instar des programmes informatiques. Le succès d'une stratégie dépend de sa performance face à des stratégies concurrentes (y compris des instances d'elle-même) et de la fréquence de leur occurrence. Maynard Smith a détaillé ses recherches dans sa publication, Evolution and the Theory of Games.

Les participants s'efforcent de maximiser leur capacité de reproduction, avec des bénéfices quantifiés en unités de condition physique, représentant leur capacité relative de reproduction. Ce cadre implique invariablement un jeu multi-joueurs avec de nombreux concurrents. Les principes directeurs intègrent la dynamique des réplicateurs, qui décrit comment les individus ayant une meilleure forme physique prolifèrent plus largement au sein de la population, tandis que les individus moins aptes sont progressivement éliminés, comme formalisé dans une équation de réplicateur. Par souci de simplicité, la dynamique des réplicateurs modélise l'hérédité mais exclut la mutation et suppose généralement une reproduction asexuée. Ces jeux sont simulés de manière itérative sans critères de terminaison prédéfinis. Les résultats englobent la dynamique des populations, le succès stratégique et l’identification de tout état d’équilibre émergent. Contrairement à la théorie des jeux classique, les joueurs ne sélectionnent ni ne modifient activement leurs stratégies ; au lieu de cela, ils sont dotés d'une stratégie à la naissance, dont leur progéniture hérite ensuite.

Jeux évolutifs

Modèles

La théorie évolutionniste des jeux intègre les principes fondamentaux de l'évolution darwinienne, en particulier la compétition (conceptualisée comme le jeu), la sélection naturelle (manifestée par la dynamique des réplicateurs) et l'hérédité. Il a considérablement fait progresser la compréhension de phénomènes tels que la sélection de groupe, la sélection sexuelle, l'altruisme, la protection parentale, la coévolution et la dynamique écologique. Grâce à l'application de ces modèles, de nombreux scénarios contre-intuitifs dans ces domaines ont été rigoureusement justifiés mathématiquement.

La dynamique évolutive dans les jeux est généralement étudiée à l'aide d'équations de réplication. Ces équations illustrent le taux de croissance de la proportion d'une stratégie spécifique au sein d'une population, assimilant ce taux à la disparité entre le gain moyen de cette stratégie et le gain moyen de la population globale. Les équations de réplication continue fonctionnent sous l’hypothèse de populations infinies, de progression temporelle continue, de mélange complet de populations et de transmission fidèle des stratégies à travers les générations. Au sein de ces équations, certains attracteurs, en particulier tous les points fixes asymptotiquement stables globaux, représentent des états évolutifs stables. Une stratégie évolutivement stable est définie comme une stratégie capable de persister contre toutes les stratégies « mutantes ». Dans le domaine du comportement animal, cela implique généralement que de telles stratégies sont génétiquement codées et profondément influencées par des facteurs héréditaires, déterminant ainsi les choix stratégiques d'un organisme ou d'un joueur à travers ces déterminants biologiques.

Les jeux évolutifs constituent des constructions mathématiques caractérisées par des règles distinctes, des structures de gains et des comportements mathématiques qui en résultent. Chaque « jeu » spécifique modélise divers défis auxquels les organismes sont confrontés, ainsi que les stratégies potentielles qu'ils pourraient employer pour survivre et se reproduire. Ces jeux se voient fréquemment attribuer des noms évocateurs et des contextes narratifs qui délimitent le scénario général d’un jeu donné. Des exemples illustratifs de tels jeux comprennent le jeu Hawk-Dove, la guerre d'usure, la chasse au cerf, le modèle producteur-escroc, la tragédie des biens communs et le dilemme du prisonnier. Les stratégies correspondantes pour ces jeux incluent, sans s'y limiter, le faucon, la colombe, le bourgeois, le prober, le transfuge, l'évaluateur et le représailles. Selon les règles spécifiques de chaque jeu, ces diverses stratégies s'engagent dans une compétition, avec une analyse mathématique utilisée pour déterminer les résultats et les comportements émergents.

Le jeu Faucon-Colombe

Le jeu phare analysé par Maynard Smith est le jeu classique Hawk-Dove. Ce modèle a été conçu pour résoudre le problème de Lorenz et Tinbergen concernant les conflits pour une ressource divisible. Les participants à ce jeu adoptent l’un des deux rôles stratégiques suivants : faucon ou colombe. Ces rôles représentent des sous-types ou formes distincts au sein d’une même espèce, chacun employant une stratégie différente. Un faucon fait d'abord preuve d'agressivité, dégénérant ensuite en une confrontation physique qui persiste jusqu'à la victoire ou la blessure (défaite). À l’inverse, une colombe fait initialement preuve d’agressivité, mais se retire en lieu sûr si elle est confrontée à une escalade significative. Si aucune escalade de ce type ne se produit, la colombe s'efforce de partager la ressource.

En supposant que la ressource possède une valeur V et que le coût encouru en cas de perte d'une confrontation est C :

Si un faucon rencontre une colombe, le faucon acquiert la totalité de la ressource V.
Lorsque deux faucons se rencontrent, ils gagnent chacun environ la moitié du temps et perdent la moitié du temps, ce qui donne un résultat moyen de V/2 à C/2.
Lorsqu'elle rencontre un faucon, une colombe se retire, sans recevoir de récompense (0).
Lorsque deux colombes se rencontrent, elles partagent la ressource, chacune obtenant V/2.

Le gain réel, cependant, dépend de la probabilité de rencontrer un faucon ou une colombe, qui reflète la proportion de chaque stratégie au sein de la population au moment d'une compétition spécifique. Cette proportion, à son tour, est déterminée par les résultats de toutes les compétitions précédentes. Lorsque le coût de la perte (C) dépasse la valeur du gain (V) – un scénario courant dans les environnements naturels – l’analyse mathématique converge vers une stratégie évolutivement stable (ESS). Cet ESS représente une stratégie mixte où la proportion de faucons dans la population se stabilise à V/C. Toute perturbation temporaire de la population, telle que l'introduction de nouveaux faucons ou tourterelles, entraînera un retour de la population à ce point d'équilibre. La résolution du jeu Hawk-Dove explique pourquoi la majorité des conflits avec des animaux impliquent des comportements de combat ritualisés plutôt que des combats directs et blessants. Fondamentalement, ce résultat ne repose pas sur des comportements de « bien de l’espèce », comme le propose Lorenz, mais plutôt exclusivement sur les implications d’actions motivées par ce que l’on appelle des « gènes égoïstes ».

La guerre d'usure

Dans le jeu Hawk-Dove, une ressource partageable rapporte des gains aux deux colombes engagées dans un concours par paires. Cependant, lorsqu’une ressource ne peut pas être partagée et qu’une alternative pourrait être accessible en la désengageant et en la recherchant ailleurs, les stratégies pures Hawk ou Dove s’avèrent moins efficaces. La combinaison d’une ressource non partageable avec un coût substantiel de perte de compétition (par exemple, blessures ou mortalité) réduit encore davantage les gains des stratégies Hawk et Dove. Par conséquent, une stratégie plus sûre et moins coûteuse, impliquant l'affichage, le bluff et l'attente prolongée, apparaît comme viable, appelée « stratégie du bluff ». Cela transforme le jeu en une accumulation de coûts, qu'ils proviennent de l'affichage ou d'un engagement prolongé et non résolu. Il fonctionne comme une vente aux enchères dans laquelle le vainqueur est le concurrent prêt à supporter le coût le plus élevé, tandis que le perdant supporte un coût équivalent mais ne gagne aucune ressource. Les modèles mathématiques de la théorie évolutionniste des jeux indiquent par conséquent que le bluff chronométré constitue une stratégie optimale.

Dans une guerre d'usure, toute stratégie inébranlable et prévisible est intrinsèquement instable, car elle finirait par être remplacée par une stratégie mutante qui la surpasse en investissant une « ressource d'attente » légèrement plus grande pour assurer la victoire. Par conséquent, seule une stratégie aléatoire et imprévisible peut persister au sein d’une population de bluffeurs. Les concurrents sélectionnent effectivement un coût acceptable, proportionnel à la valeur de la ressource souhaitée, faisant ainsi une offre aléatoire dans le cadre d'une stratégie mixte, une stratégie englobant de multiples actions potentielles. Ce processus établit une répartition des offres pour une ressource d'une valeur spécifique V, à partir de laquelle l'offre pour un concours donné est sélectionnée au hasard. Cette distribution, représentant une stratégie évolutivement stable (ESS), peut être calculée à l'aide du théorème de Bishop-Cannings, qui s'applique à toutes les ESS à stratégie mixte. Parker et Thompson ont déterminé la fonction de distribution de ces concours comme suit :

p(x)={\frac {e^{-x/V}}{V}}.

Par conséquent, la population cumulée d'individus qui se retirent (abandonnent) à un coût spécifique « m » au sein de cette solution à stratégie mixte est définie comme :

p(m)=1-e^{-m/V},

17§ − e − m / V , {\displaystyle p(m)=1-e^{-m/V},}

Cette relation est représentée visuellement dans le graphique ci-contre. L’hypothèse intuitive selon laquelle des valeurs de ressources plus élevées sont corrélées à des temps d’attente prolongés est étayée empiriquement. De tels phénomènes sont observables dans des contextes naturels, par exemple chez les mouches mâles en compétition pour les sites d'accouplement, où le moment du désengagement de la compétition s'aligne avec les prédictions dérivées de la théorie des jeux évolutionniste.

L'émergence de nouvelles stratégies grâce aux asymétries

Dans une guerre d'usure, l'absence d'indices signalant à un adversaire le montant de l'enchère est cruciale ; sinon, ces informations pourraient être exploitées pour une contre-stratégie efficace. Néanmoins, une stratégie « mutante », connue sous le nom de stratégie bourgeoise, peut surpasser un bluffeur dans la guerre d'usure si une asymétrie appropriée est présente. La stratégie bourgeoise exploite une asymétrie existante pour sortir des impasses. Dans les milieux naturels, la possession des ressources constitue souvent une telle asymétrie. Cette stratégie impose de jouer un faucon lorsque l'on possède la ressource, mais de l'afficher puis de battre en retraite lorsqu'il n'est pas en possession. Tout en exigeant une plus grande capacité cognitive qu'une stratégie purement faucon, la stratégie bourgeoise est répandue dans de nombreux concours d'animaux, illustrés par les interactions entre les crevettes mantes et les papillons des bois mouchetés.

Comportement social

Des jeux tels que Hawk-Dove et War of Attrition illustrent une pure compétition interindividuelle, dépourvue de composantes sociales. Lorsque les influences sociales sont présentes, les concurrents peuvent s'engager dans des interactions stratégiques à travers quatre alternatives distinctes. Ces alternatives sont illustrées dans la figure ci-jointe, où un signe plus indique un avantage et un signe moins indique un coût.

Dans une relation coopérative ou mutualiste, les rôles de « donateur » et de « bénéficiaire » deviennent presque indiscernables, car les deux parties tirent un bénéfice de leur collaboration au sein du jeu. Cela implique un scénario stratégique dans lequel une action conjointe génère des gains mutuels, ou dans lequel des contraintes globales nécessitent un comportement concerté, plaçant effectivement les deux entités dans une situation difficile commune.
Une relation altruiste implique qu'un donateur supporte un coût pour conférer un avantage à un bénéficiaire. En règle générale, le bénéficiaire partage un lien de parenté avec le donateur et le transfert des bénéfices est unidirectionnel. Alors que les comportements impliquant un échange de bénéfices réciproques, chacun entraînant un coût, sont souvent qualifiés d'« altruistes », un examen plus approfondi révèle souvent qu'un tel « altruisme » découle de stratégies « égoïstes » optimisées.
Spite représente fondamentalement une forme de coopération « inversée », dans laquelle aucun des participants n'obtient un avantage direct et tangible. Généralement, l’allié est lié à la parenté et l’avantage conféré est un environnement concurrentiel moins difficile pour cet allié. George Price, un modélisateur mathématique pionnier de l'altruisme et de la méchanceté, aurait trouvé cette équivalence conceptuelle émotionnellement déstabilisante.
Du point de vue de la théorie des jeux, l'égoïsme constitue le critère fondamental de toutes les décisions stratégiques ; les stratégies qui ne donnent pas la priorité à l’auto-préservation et à l’auto-réplication ne sont viables dans aucun jeu. Fondamentalement, cette dynamique est compliquée par la nature à plusieurs niveaux de la compétition, englobant les niveaux génétiques, individuels et collectifs.

La compétition des gènes égoïstes

Au départ, il pourrait sembler que les participants aux jeux évolutifs soient les individus de chaque génération directement impliqués dans le jeu. Cependant, les individus ne persistent que pendant un seul cycle de jeu ; ce sont plutôt les stratégies elles-mêmes qui entrent véritablement en compétition dans ces jeux multigénérationnels. Par conséquent, ce sont les gènes qui, en fin de compte, exécutent l’ensemble du combat – en particulier les gènes égoïstes qui incarnent ces stratégies. Ces gènes concurrents résident chez un individu et, dans une certaine mesure, chez tous les parents de cet individu. Cette présence génétique peut profondément influencer la survie de stratégies particulières, notamment en matière de coopération et de défection. W. D. Hamilton, célèbre pour sa théorie de la sélection des parents, a étudié de nombreux scénarios de ce type à l'aide de modèles de la théorie des jeux. Une approche des concours de jeu basée sur la parenté élucide divers aspects du comportement social des insectes, des interactions altruistes parents-progéniture, des mécanismes de protection mutuelle et des soins coopératifs à la progéniture. Pour ces types de jeux, Hamilton a introduit un concept élargi de fitness : le fitness inclusif, qui prend en compte la progéniture directe d'un individu aux côtés de toute progéniture équivalente trouvée parmi ses proches.

Au-delà des liens de parenté, Hamilton a collaboré avec Robert Axelrod pour analyser les jeux coopératifs dans des contextes où la parenté était absente et où l'altruisme réciproque est devenu un facteur important.

Eusocialité et sélection des parents

Les insectes ouvrières eusociales renoncent à leurs droits reproductifs au profit de la reine. Il a été avancé que la sélection des parents, influencée par la composition génétique de ces travailleurs, pourrait les prédisposer à des comportements altruistes. La majorité des sociétés d'insectes eusociales présentent une détermination sexuelle haplodiploïde, ce qui se traduit par un degré de parenté exceptionnellement élevé entre les travailleurs.

Cependant, cette explication de l'eusocialité des insectes a été contestée par plusieurs théoriciens des jeux évolutionnistes de premier plan, notamment Nowak et Wilson. Ils ont publié une explication alternative controversée de la théorie des jeux, qui postule un processus de développement séquentiel et des effets de sélection de groupe comme facteurs déterminants pour ces espèces d'insectes.

Le dilemme du prisonnier

Le phénomène de l'altruisme représentait un défi important pour la théorie de l'évolution, une difficulté reconnue par Darwin lui-même. Alors que la sélection au niveau individuel rend les comportements altruistes apparemment illogiques, la sélection universelle au niveau du groupe, postulée pour le bénéfice de l’espèce plutôt que de l’individu, ne résiste pas à l’examen mathématique de la théorie des jeux et n’est généralement pas observée dans la nature. Néanmoins, le comportement altruiste est répandu chez de nombreux animaux sociaux. La résolution de ce paradoxe se trouve dans l'application de la théorie évolutionniste des jeux au dilemme du prisonnier, un jeu largement étudié qui évalue les gains associés à la coopération par rapport à la défection.

Le dilemme du prisonnier est fréquemment analysé comme un jeu répétitif, qui donne aux participants la possibilité de riposter en cas de défections antérieures. De nombreuses stratégies ont été étudiées, les approches concurrentielles les plus efficaces impliquant généralement une coopération initiale couplée à une réponse conditionnelle de représailles. Parmi celles-ci, la stratégie du tac au tac, caractérisée par un algorithme simple, se distingue comme particulièrement reconnue et réussie.

Les gains pour chaque tour de jeu sont déterminés par une matrice de gains spécifique. Dans les scénarios à plusieurs tours, des choix individuels – coopérer ou faire défection – sont faits à chaque tour, donnant lieu à un gain particulier. Cependant, ce sont les gains cumulés accumulés sur plusieurs tours qui sont essentiels pour évaluer et façonner l'efficacité globale des diverses stratégies à plusieurs tours, telles que le tac pour le tac.

L'exemple 1 illustre le dilemme fondamental du prisonnier à un seul tour. Dans cette formulation classique, un joueur obtient le gain maximum en faisant défection tandis que son partenaire coopère ; ce résultat est appelé tentation. À l’inverse, si un joueur coopère et que son partenaire fait défaut, le joueur reçoit le pire résultat possible, connu sous le nom de récompense du meunier. Dans ces conditions de paiement, le choix optimal, représentant un équilibre de Nash, est de faire défection.

L'exemple 2 examine le dilemme du prisonnier lorsqu'il est joué à plusieurs reprises. La stratégie employée ici est le tit-for-tat, qui modifie le comportement en fonction de l'action du partenaire au cours du tour précédent, récompensant efficacement la coopération et punissant la défection. Au cours de nombreux tours, cette stratégie conduit à des gains accumulés plus élevés pour les deux joueurs grâce à une coopération mutuelle et à des gains réduits en cas de défection. Par conséquent, l'incitation à la défection est diminuée, et les gains du meunier diminuent également, bien que l'élimination complète de « l'invasion » par une stratégie purement défectueuse ne soit pas garantie.

Voies évolutives vers l'altruisme

L'altruisme est défini comme un individu entreprenant une stratégie qui engendre un coût (C) pour lui-même tout en apportant un bénéfice (B) à un autre individu. Ce coût peut se manifester par une réduction des capacités ou des ressources vitales pour la survie et la reproduction, ou par un risque accru pour la propre survie de l'altruiste. Des stratégies altruistes peuvent émerger à travers plusieurs mécanismes, notamment :

La stratégie évolutivement stable

La stratégie évolutivement stable (ESS) partage des similitudes conceptuelles avec l'équilibre de Nash dans la théorie classique des jeux, mais intègre des critères mathématiques étendus. Un équilibre de Nash représente un état de jeu dans lequel aucun joueur ne peut rationnellement améliorer son résultat en modifiant unilatéralement sa stratégie, en supposant que les autres maintiennent la leur. Cependant, un ESS décrit un équilibre dynamique au sein d'une très grande population de concurrents, dans lequel aucune stratégie mutante alternative ne peut réussir à infiltrer et à perturber la dynamique de population existante, qui elle-même dépend de la composition stratégique de la population. Par conséquent, un SSE réussi doit être efficace à la fois lorsqu’il est rare – permettant son entrée initiale dans une population concurrente – et lorsqu’il est répandu – lui permettant de se défendre contre d’autres stratégies. Cela implique qu'un ESS doit être robuste même face à des stratégies identiques.

Il est important de préciser qu'un ESS n'est pas :

Une stratégie optimale : un ESS ne maximise pas nécessairement la forme physique, et de nombreux états de l'ESS existent bien en dessous de la forme physique maximale théorique atteignable dans un paysage de forme physique donné.
Une solution unique : les scénarios concurrentiels permettent souvent l'existence de plusieurs conditions ESS. Un concours particulier peut se stabiliser dans l'une de ces possibilités, mais des perturbations environnementales substantielles peuvent ensuite déplacer le système vers un état ESS alternatif.
Il n'existe pas toujours de SSE ; certains jeux évolutifs n'ont pas d'ESS. Un exemple notable de jeu évolutif sans ESS est le jeu « pierre-ciseaux-papier », observé chez des espèces comme le lézard à taches latérales (Uta stansburiana).
Bien qu'elle soit souvent perçue comme une stratégie imbattable, une ESS est plus précisément définie comme une stratégie invincible.

La détermination d'un état ESS implique deux approches principales : analyser la dynamique de l'évolution de la population ou résoudre des équations qui définissent les conditions de points stationnaires stables. Par exemple, dans le jeu faucon-colombe, on peut identifier un équilibre de population statique où la condition physique des colombes correspond précisément à celle des faucons, indiquant des taux de croissance équivalents et un point stable.

Soit « p » représentant la probabilité de rencontrer un faucon, ce qui implique que la probabilité de rencontrer une colombe est de (1-p).

Laissez Whawk désigner le gain pour un faucon.

Le gain pour un faucon (Whawk). est calculé comme la somme de son gain lorsqu'il rencontre une colombe et de son gain lorsqu'il rencontre un autre faucon.

En remplaçant les valeurs de la matrice de gain dans l'équation susmentionnée :

Whawk= V·(1-p)+(V/2-C/2)·p

Un calcul similaire s'applique à un colombe :

Wdove= V/2·(1-p)+0·(p)

Par conséquent,

Wdove= V/2·(1-p)

Pour trouver l'équilibre, les fitness des stratégies de faucon et de colombe sont égal :

V·(1-p)+(V/2-C/2)·p= V/2·(1-p)

La résolution de cette équation pour 'p' donne :

p= V/C

Par conséquent, à cet équilibre statique point, l'ESS pour le pourcentage de population de faucons est calculé comme ESS_{(percent Hawk)}=V/C.

De plus, grâce à l'application des inégalités, il peut être démontré que l'introduction d'un mutant supplémentaire de faucon ou de colombe dans cet état ESS diminue finalement l'aptitude de leurs types respectifs, confirmant à la fois un véritable équilibre de Nash et un ESS. Cette illustration souligne que lorsque les coûts du conflit, tels que les blessures ou la mortalité (C), dépassent largement les avantages potentiels (V), la population stable comprendra un mélange d'agresseurs et de colombes, les colombes constituant une proportion plus importante. Ce constat permet d'expliquer divers comportements observés dans les milieux naturels.

Jeux instables et dynamiques cycliques

Jeu Pierre-Papier-Ciseaux

Le jeu Pierre-Papier-Ciseaux (RPS), lorsqu'il est intégré dans un cadre de jeu évolutif, a été utilisé pour modéliser des processus naturels dans le cadre d'études écologiques. Les chercheurs ont également utilisé les jeux RPS en économie expérimentale pour étudier la dynamique de l’évolution sociale humaine en laboratoire. Ces expériences ont systématiquement révélé les comportements sociaux cycliques prédits par la théorie évolutionniste des jeux.

Le lézard à taches latérales et les jeux cycliques

La première observation naturelle d'une dynamique de type RPS a été identifiée dans les comportements et la coloration de la gorge d'un petit lézard originaire de l'ouest de l'Amérique du Nord. Le lézard à taches latérales (Uta stansburiana) présente un polymorphisme, avec trois formes distinctes de couleur de gorge, chacune employant une stratégie d'accouplement unique :

La forme à gorge orange fait preuve d'une grande agressivité, contrôle un vaste territoire et cherche à s'accoupler avec plusieurs femelles.
La forme non agressive à gorge jaune imite l'apparence et le comportement des femelles lézards, lui permettant d'infiltrer secrètement les territoires des mâles à gorge orange pour s'accoupler avec les femelles, obtenant ainsi un avantage reproductif.
La forme à gorge bleue s'accouple avec une seule femelle et la garde avec diligence, empêchant ainsi les mâles à gorge jaune « sneaker » de réussir et par conséquent les déplacer dans la population.

Néanmoins, les mâles à gorge bleue sont incapables de vaincre les mâles à gorge orange, plus agressifs. Des recherches ultérieures ont révélé que les mâles bleus présentent un comportement altruiste envers les autres mâles bleus, caractérisé par trois traits principaux : ils communiquent en utilisant leur coloration bleue, ils identifient et établissent une proximité avec d'autres mâles bleus (sans lien de parenté), et ils défendront même leurs partenaires contre les mâles à gorge orange, parfois jusqu'à la mort. Ce phénomène est révélateur d'un jeu coopératif distinct impliquant un effet barbe verte.

Au sein d'une population donnée, les femelles présentent une coloration de la gorge constante, ce qui influence à la fois leur capacité de reproduction et la taille de leur progéniture. Cette dynamique, à son tour, génère des cycles dépendants de la densité, constituant une autre forme d'interaction connue sous le nom de jeu r-K. Dans ce contexte, r représente le paramètre malthusien, qui dicte une croissance démographique exponentielle, tandis que K désigne la capacité de charge environnementale. Les femelles à gorge orange produisent généralement de plus grandes couvées de progéniture plus petite, une stratégie avantageuse dans les environnements à faible densité. À l’inverse, les femelles à gorge jaune et bleue donnent naissance à des couvées plus petites avec une progéniture plus grande, une tactique plus efficace dans des conditions de forte densité. Ces interactions établissent par conséquent des cycles perpétuels intrinsèquement liés aux fluctuations de la densité de population. Le concept de cycles pilotés par la régulation dépendant de la densité de deux stratégies distinctes a été initialement proposé par le chercheur sur les rongeurs Dennis Chitty, conduisant à la désignation de ces interactions sous le nom de « cycles de Chitty ». Les populations naturelles présentent fréquemment des couches hiérarchiques de jeux évolutifs intégrés. Ces interactions complexes déterminent les cycles Pierre-Papier-Ciseaux (RPS) chez les hommes, caractérisés par une périodicité de quatre ans, et les cycles r-K chez les femmes, sur une période de deux ans.

Le scénario écologique global reflète la dynamique du jeu Pierre-Papier-Ciseaux, établissant ainsi un cycle de population de quatre ans. Bien que le jeu RPS parmi les lézards mâles à taches latérales ne dispose pas d'une stratégie évolutive stable (ESS), il possède un équilibre de Nash (NE), caractérisé par une dynamique orbitale perpétuelle autour de l'attracteur NE. À la suite de ces recherches sur les lézards à taches latérales, de nombreux autres polymorphismes à trois stratégies ont été identifiés chez diverses espèces de lézards. Certains d'entre eux présentent une dynamique RPS, intégrant à la fois le jeu spécifique aux hommes et la régulation de la densité au sein d'un seul sexe (mâles). Des enquêtes récentes ont révélé que les mammifères hébergent également des jeux RPS analogues chez les mâles et des jeux r-K chez les femelles, présentant des polymorphismes de couleur de robe et des comportements associés qui suscitent des modèles cycliques. De plus, ce jeu est impliqué dans l’évolution des soins parentaux mâles et de la monogamie chez les rongeurs, et influence de manière significative les taux de spéciation. Les jeux de stratégie r-K sont manifestement liés aux cycles de population observés à la fois chez les rongeurs et les lézards.

En apprenant que ces lézards étaient fondamentalement engagés dans un jeu structuré Pierre-Papier-Ciseaux, John Maynard Smith se serait exclamé : "Ils ont lu mon livre !"

Signalisation, sélection sexuelle et principe de handicap

Au-delà du défi consistant à élucider la prévalence de l'altruisme dans de nombreux organismes évolués, Darwin était aux prises avec une énigme secondaire : l'existence d'attributs phénotypiques chez un nombre important d'espèces qui sont ouvertement préjudiciables à leur survie et, par conséquent, devraient être sélectionnés par des processus naturels. Un bon exemple est la structure encombrante et étendue des plumes de la queue du paon. À ce propos, Darwin a déclaré à un collègue : « La vue d'une plume dans la queue d'un paon, chaque fois que je la regarde, me rend malade. » Le cadre mathématique de la théorie évolutionniste des jeux a fourni des explications non seulement pour l'existence de l'altruisme mais aussi pour la présence apparemment contre-intuitive de structures comme la queue du paon et d'autres encombrements biologiques similaires.

Les défis inhérents à l'existence biologique, tels que l'acquisition de ressources, la survie et la reproduction, présentent des parallèles frappants avec des principes économiques fondamentaux tels que la gestion des ressources, la stratégie concurrentielle et l'analyse risque-rendement des investissements. La théorie des jeux, initialement développée pour l’analyse économique, s’est donc révélée très efficace pour élucider de nombreux comportements biologiques. Un raffinement significatif de la théorie évolutionniste des jeux, particulièrement pertinent pour les concepts économiques, implique l'analyse sophistiquée des coûts. Même si les modèles de coûts rudimentaires postulent des sanctions uniformes pour tous les concurrents, cette hypothèse est souvent inexacte. Les participants les plus performants possèdent ou accumulent généralement de plus grandes « réserves de richesse » ou « abordabilité » par rapport à leurs homologues moins performants. Dans la théorie évolutionniste des jeux, cet « effet de richesse » est représenté mathématiquement par le « potentiel de détention de ressources (RHP) », démontrant que le coût effectif supporté par un concurrent avec un RHP plus élevé est moins important que pour un concurrent avec un RHP plus faible. Étant donné que les individus ayant un RHP plus élevé sont des partenaires plus désirables, capables de produire une progéniture potentiellement prospère, il est logique que la sélection sexuelle soit à l'origine de l'évolution de la signalisation RHP parmi les rivaux. Pour qu’un tel signal soit efficace, il doit être transmis honnêtement. Amotz Zahavi a formalisé ce concept sous le nom de « principe du handicap », selon lequel des concurrents supérieurs affichent ouvertement leur domination au moyen d'expositions coûteuses. Étant donné que les individus ayant un RHP plus élevé peuvent véritablement supporter les dépenses liées à de tels affichages, cette signalisation est intrinsèquement honnête et interprétée de manière fiable par les récepteurs. Une illustration naturelle marquante de ce phénomène est le plumage élaboré et coûteux du paon. Alan Grafen a ensuite fourni une validation mathématique du principe du handicap grâce à une modélisation évolutive de la théorie des jeux.

Dynamique coévolutionnaire

La théorie évolutionniste des jeux identifie généralement deux catégories principales de résultats dynamiques :

Jeux évolutifs qui convergent vers un équilibre stable ou un point de stase pour des stratégies concurrentes, conduisant finalement à une stratégie évolutive stable.
Jeux évolutifs qui démontrent un comportement cyclique, tels que le jeu Pierre-Papier-Ciseaux (RPS), dans lequel les proportions de stratégies rivales au sein de la population globale fluctuent continuellement au fil du temps.

Une troisième dynamique, dite coévolutive, intègre des interactions compétitives à la fois intra-spécifiques et inter-spécifiques. Des exemples illustratifs incluent la dynamique prédateur-proie, la coévolution hôte-parasite et les relations mutualistes. Des modèles de jeu évolutifs ont été développés pour analyser les systèmes coévolutifs par paires et multi-espèces, la dynamique globale variant considérablement entre les contextes compétitifs et mutualistes.

Au sein des systèmes coévolutifs inter-espèces compétitifs (non mutualistes), les espèces s'engagent dans une course aux armements évolutive, dans laquelle les adaptations améliorant l'avantage compétitif par rapport aux autres espèces sont sélectionnées préférentiellement. Ce phénomène se reflète à la fois dans les gains du jeu et dans la dynamique des réplicateurs, culminant dans une dynamique Red Queen. Dans ce scénario, les espèces en interaction doivent évoluer continuellement simplement pour maintenir leur forme physique relative ou leur position écologique.

De nombreux modèles de théorie des jeux évolutifs ont été formulés pour aborder des scénarios de coévolution. Un élément essentiel de ces systèmes est l’adaptation stratégique incessante caractéristique des courses aux armements évolutives. Par conséquent, la modélisation coévolutive intègre fréquemment des algorithmes génétiques pour représenter les effets mutationnels, tandis que des simulations informatiques sont utilisées pour analyser la dynamique globale du jeu coévolutif. La dynamique qui en résulte est ensuite étudiée en modifiant systématiquement divers paramètres. Compte tenu de l’interaction simultanée de plusieurs variables, l’identification de solutions optimales nécessite des techniques d’optimisation multi-variables. Les références mathématiques pour établir des points stables dans de tels systèmes multivariables sont l'efficacité de Pareto et la dominance de Pareto, qui servent de mesures des pics d'optimalité des solutions.

Carl Bergstrom et Michael Lachmann ont appliqué la théorie des jeux évolutive pour étudier la répartition des avantages au sein des interactions mutualistes entre organismes. Leurs modèles, qui intègrent des hypothèses darwiniennes concernant la condition physique et utilisent la dynamique des réplicateurs, démontrent que l'organisme évoluant à un rythme relativement plus lent au sein d'un partenariat mutualiste a tendance à acquérir une part disproportionnée des bénéfices ou des récompenses accumulés.

Extensions de modèle

Au départ, un modèle mathématique conçu pour analyser le comportement d'un système doit conserver une simplicité maximale pour faciliter une compréhension fondamentale de ses principes fondamentaux, souvent appelés « effets de premier ordre ». Une fois cette compréhension fondamentale établie, il devient approprié d’examiner si des paramètres plus nuancés, ou « effets de second ordre », exercent une influence supplémentaire sur les comportements primaires ou contribuent à l’émergence de comportements systémiques supplémentaires. Suite aux contributions fondamentales de Maynard Smith à la théorie évolutionniste des jeux, le domaine a connu une expansion substantielle, améliorant considérablement la compréhension de la dynamique évolutive, en particulier concernant les comportements altruistes. Les principales extensions de la théorie des jeux évolutionniste incluent :

Jeux spatiaux

Les processus évolutifs sont influencés par des facteurs géographiques tels que le flux génétique et le transfert horizontal de gènes. Les modèles de jeux spatiaux intègrent des considérations géométriques en positionnant les agents en interaction dans un réseau cellulaire, où les interactions sont limitées aux voisins immédiats. Les stratégies efficaces se propagent dans ces environs immédiats et s’impliquent ensuite dans les zones adjacentes. Ce modèle démontre efficacement comment des groupes localisés de coopérateurs peuvent s'infiltrer et établir l'altruisme dans le jeu du dilemme du prisonnier, même si Tit for Tat (TFT) constitue un équilibre de Nash mais pas une stratégie évolutivement stable (ESS). Parfois, la structure spatiale est conceptualisée comme un réseau généralisé d'interactions, formant la base de la théorie des graphes évolutionnaires.

Impact de la disponibilité des informations

Dans la théorie des jeux évolutionniste et conventionnelle, l'influence de la signalisation, définie comme l'acquisition d'informations, revêt une importance primordiale. Ceci est illustré par la réciprocité indirecte dans le dilemme du prisonnier, en particulier dans les scénarios où les interactions entre individus identiques ne sont pas récurrentes. De tels modèles reflètent la dynamique des interactions sociales non apparentées les plus typiques. En l'absence d'une mesure probabiliste de la réputation dans le cadre du dilemme du prisonnier, seule la réciprocité directe est réalisable ; cependant, la disponibilité de telles informations facilite la réciprocité indirecte.

Alternativement, les agents peuvent posséder un signal arbitraire qui manque initialement de corrélation avec la stratégie mais qui devient ensuite corrélé à travers la dynamique évolutive. Ce phénomène est connu sous le nom d’effet barbe verte et est également impliqué dans l’évolution de l’ethnocentrisme au sein des populations humaines. Le contexte spécifique du jeu détermine si ce mécanisme favorise l'évolution de la coopération ou de l'hostilité irrationnelle.

Un modèle de jeu de signalisation, caractérisé par une asymétrie d'information entre l'expéditeur et le récepteur, peut être applicable à diverses échelles biologiques, du niveau moléculaire au niveau multicellulaire. Les exemples incluent sa pertinence pour l'attraction du partenaire ou le développement évolutif de la machinerie traductionnelle à partir de séquences d'ARN.

Populations finies

De nombreux jeux évolutifs ont été modélisés au sein de populations finies pour vérifier l'impact potentiel de la taille de la population, notamment en ce qui concerne l'efficacité des stratégies mixtes.

Remarques

Références

Davis, Morton ; « Théorie des jeux – Une introduction non technique », Dover Books, ISBN 0-486-29672-5.

Davis, Morton ; "Théorie des jeux – Une introduction non technique", Dover Books, ISBN 0-486-29672-5
Dawkins, Richard (2006). Le gène égoïste (éd. 30e anniversaire). Oxford : Presse universitaire d'Oxford. ISBN 978-0-19-929115-1.0-19-513790-6.
Hofbauer, J. et Sigmund, K. ; "Jeux évolutifs et dynamique des populations", Cambridge University Press, ISBN 0-521-62570-X.
Kohn, Marek ; "Une raison pour tout", Faber et Faber, ISBN 0-571-22393-1.
Li Richter et Lehtonen (éd.) ; "Un demi-siècle de jeux évolutionnistes : une synthèse de la théorie, de l'application et des orientations futures", Philosophical Transactions of the Royal Society B, Volume 378, Numéro 1876.
Sandholm, William H. ; "Jeux de population et dynamique évolutive", The MIT Press, ISBN 0262195879.
Segerstrale, Ullica ; « L'Oracle de la nature – La vie et l'œuvre de W.D. Hamilton », Oxford University Press, 2013, ISBN 978-0-19-860727-4.
Sigmund, Karl ; "Jeux de la vie", Penguin Books, également Oxford University Press, 1993, ISBN 0198547838.
Vincent et Brown ; "Théorie évolutionnaire des jeux, sélection naturelle et dynamique darwinienne", Cambridge University Press, ISBN 0-521-84170-4.

Numéro thématique « Un demi-siècle de jeux évolutifs : une synthèse de la théorie, de l'application et des orientations futures » (2023)
Théorie évolutionniste des jeux à la Stanford Encyclopedia of Philosophy
Des recherches sur l'évolution des écologies morales artificielles sont menées au Centre d'éthique appliquée de l'Université de la Colombie-Britannique.
"La vie et l'œuvre de John Maynard Smith, interviewés par Richard Dawkins." Web of Stories, 1997, consulté via YouTube.Source : Archives de l'Académie TORIma

Théorie des jeux évolutionniste (Evolutionary game theory)