Add to favourites
News Local and Global in your language
19th of July 2018

High-Tech



Quand l’IA apprend toute seule à jouer à Quake

Tous ceux qui alertent sur les dangers en germe dans les progrès de l'intelligence artificielle, voire craignent pour l'avenir de l'espèce humaine, seront heureux d'apprendre que DeepMind a appris à des agents artificiels à jouer à Quake III Arena, un… jeu de tir en vue subjective ! Résultat ? L'IA s'est avérée nettement plus performante que des joueurs humains…

Pour être exact, ce ne sont pas les chercheurs de DeepMind, division intelligence artificielle de Google, qui ont entraîné ces agents (appelés aussi "bots"). Ce sont ces derniers qui ont appris par eux-mêmes à se déplacer et se repérer dans cet environnement en 3D, à interagir avec les divers éléments (notamment les adversaires et coéquipiers), à échafauder des stratégies et à comprendre les enjeux. DeepMind a utilisé la méthode dite de l'apprentissage par renforcement. Cette technique consiste à faire apprendre à un programme comment agir en le laissant faire, sans l'entraîner au préalable sur un jeu de données ou, pour le cas présent, sans lui inculquer les règles du jeu. Autrement dit : il apprend à apprendre.

Une méthode facilement applicable au jeu

Le mécanisme d'apprentissage dépend ici d'un signal de gratification ou de pénalité envoyé au programme. En l'occurrence, avec un jeu vidéo, l'IA comprend si ses actions sont bien ou mal fondées parce qu'elle gagne ou perd la partie. C'est pourquoi la méthode marche particulièrement bien dans le cadre d'un jeu. Le laboratoire d'intelligence artificielle de Facebook s'est également livré à de tels tests avec Doom (un autre jeu de tir) ou le jeu de stratégie en temps réel StarCraft.

Les agents artificiels ne connaissaient donc rien à Quake III Arena, ce sont leurs milliers de parties, leurs échecs et leurs réussites, qui les ont fait progresser. Les chercheurs ont utilisé le mode "Capture du drapeau" du jeu qui se pratique en équipe et consiste à attraper et ramener dans son camp le drapeau de l'équipe adverse planté sur leur base, tout en protégeant le sien.

Comme l'équipe le signale sur un post de blog dédié à ce projet "les règles de Capturer le Drapeau sont simple mais les dynamiques sont complexes". Elles nécessitent coordination, réactivité et la mise en oeuvre de tactiques défensives et offensives. Les chercheurs ont aussi compliqué la tâche des bots : à chaque nouvelle partie, l'environnement 3D était modifié, afin que l'apprentissage ne soit pas lié à un cadre précis mais valable en toute circonstance. Enfin, les bots, comme n'importe quel joueur humain, n'avaient accès à aucune autre donnée que les images, les pixels, pour apprendre.

[embedded content]

Autre subtilité, une trentaine de bots ont été formés à Quake III, et non un seul, histoire de disposer de plusieurs agents ayant chacun leur style de jeu, leur stratégie, leur manière de collaborer ou de s'affronter. Sur ces bases, un demi-million de parties de cinq minutes ont été jouées avant que les agents artificiels ne sachent vraiment se débrouiller.

Après quoi, DeepMind a organisé un tournoi avec 40 joueurs humains. Ont été constitués trois types d'équipes de deux participants : des duos de bots, des duos humains et des duos bot-humain. Bilan ? Les équipes d'agents artificiels battent plus souvent les équipes bot-humain ou humain-humain qu'elles ne sont battues. "Même après douze heures de jeu, des humains n'ont été capables d'atteindre qu'un taux de victoire de 25% contre les agents artificiels" Et encore, c'est seulement lorsqu'il faisait équipe avec un bot qu'un humain a pu vaincre une équipe de bots.

Bien sûr, le but du projet n'est pas d'apprendre à une AI à faire des jeux vidéo. Le véritable enjeu est de tester la méthode de l'apprentissage par renforcement, ses possibilités, sa robustesse. Elle a l'inconvénient d'imposer une laborieuse phase d'essai-erreur mais le grand avantage de pouvoir s'affranchir d'une base de données d'entraînement. Récemment, par exemple, une équipe d'Inria l'a utilisée dans le cadre de la conduite autonome.

Read More




Leave A Comment

More News

High-tech - Sciences et

LEXPRESS.fr - Rss High-Tech

Le Matin High-Tech

Le Parisien - High-Tech

Disclaimer and Notice:WorldProNews.com is not the owner of these news or any information published on this site.