Pourquoi mon chat est plus intelligent qu’AlphaGo, programme informatique mis au point par la société britannique Google DeepMind?

Le 18 octobre 2017, l’entreprise Google DeepMind annonçait que sa nouvelle version d’intelligence artificielle AlphaGo Zero venait de battre un des plus grands joueurs en 70 heures et le précédent AlphaGo Master en 40 jours.

La nouvelle est de taille puisque le nouvel AlphaGo a appris en dehors de tout apprentissage supervisé c’est à dire en dehors de toute observation et assimilation de parties réalisées par des humains. AlphaGo Zero apprend seul en utilisant la connaissance des règles de base –très complexes – du jeu de go et en apprenant grâce à la technique de l’apprentissage par renforcement c’est à dire en jouant un très grand nombre de fois contre lui-même. Grâce à la fusion de deux réseaux neuronaux : celui de la décision et celui de la prédiction liée à la situation des pierres sur le tableau et suite à cette intense répétition qui dépasse les limites biologiques et physiologique d’un corps humain (4,9 milliers de parties en 3 jours !) il apparaît, à la faveur des résultats et de leur rapidité, qu’Alpha Go Zero est capable de trouver seul des solutions pertinentes voire originales. Ainsi, si l’on considère que l’intelligence est la possibilité de manipuler un nombre considérable d’informations puis d’agir et d’inventer en fonction de l’évaluation des effets de son action ; effectivement, AlphaGo Zero est une machine intelligente et l’on peut saluer le travail des spécialistes qui l’ont mise au point.

Mais alors, pourquoi mon chat est plus intelligent qu’AlphaGo Zero ?

L’intelligence d’AlphaGo repose sur deux paramètres essentiels en matière d’intelligence : d’une part le nombre d’informations et d’autre part le nombre de connexions qui les met en relation. Chaque unité d’information étant très simple, c’est le nombre total des connexions, proportionnel au nombre d’unités, qui permet de réaliser des opérations très complexes. La valeur étant liée à la prédiction c’est à dire à la faculté de prévoir les effets et résultats de la décision, il est donc logique qu’AlphaGo ait besoin d’un très grand nombre de répétitions pour réaliser son apprentissage. Je le répète : un corps humain serait incapable de réaliser une telle performance d’analyse en si peu de temps car le temps de l’analyse et de la prédiction est souvent un temps long.

Nombre d’unités d’informations, nombre de connexions, nombre d’expérimentations, autant de paramètres d’ordre quantitatif. L’intelligence artificielle démultiplie ces facteurs quantitatifs en les soustrayant aux limites physiques d’un corps soumis à certaines limites, notamment, celles de l’espace et du temps. Néanmoins, AlphaGo Zero reste toujours limité par le cadre de procédures auquel il répond : les règles du jeu de go et la pondération par un algorithme qui, comme le définit le dictionnaire Larousse est « un ensemble de règles opératoires dont l’application permet de résoudre un problème énoncé au moyen d’un nombre fini d’opérations ». Ainsi, selon les propos de Tristan Cazenave – professeur à Paris Dauphine et spécialiste des jeux au laboratoire Lamsade – relatés dans un article du Monde Pixels du 19 octobre 2017 « pour appliquer cette méthode, il faut que le cadre soit très défini, qu’on ait une représentation solide du domaine, pas trop flou dans les règles et que le problème soit bien défini. Cela s’applique bien au jeu car il y a une connaissance parfaite de l’environnement, des règles et qu’il y a peu d’imprévu. » 

Ainsi, a-t-on essayé de perturber AlphaGo Zero par une situation sortant totalement de la logique établie par les règles habituelles ?

En étant à la fois ordre et désordre, la vie est continuellement remplie de ces perturbations qui entretiennent son mouvement incessant et, ce matin, mon chat l’a très vite compris. Depuis hier, il prend un médicament que nous devons lui faire ingérer par pipette, fait inhabituel et très désagréable que ce soit pour lui comme pour nous. Or, ce matin, il se méfie et n’entre pas aussi rapidement dans la cuisine… Il ne lui a pas fallu des milliers de répétitions ou des quantités d’informations à connecter pour adapter son action à un contexte inhabituel. Issues de son environnement, les informations qu’il utilise alors ne sont pas d’ordre quantitatif mais d’ordre qualitatif : intonation de la voie, gestuelle corporelle, odeur etc. La puissance de ces valeurs qualitatives n’est pas relative à leur nombre. Elle est même certainement inversement proportionnelle à leur quantité. En résumé, plus l’information est à la marge, plus elle risque d’être opérante dans ses effets. C’est pourquoi, en valorisant à l’excès les notions de quantité couplées à des procédures, les généralisations issues d’une moyenne et les algorithmes, sans se soucier des valeurs de qualité –vécues directement par le corps, liées au sensible et à l’immédiateté de la capacité de différenciation- nous réduisons considérablement le part créatrice et dynamique du vivant et prenons plusieurs risques :

-Premièrement, celle de limiter notre faculté d’adaptation face à l’imprévu, dynamique vitale indispensable.

-Deuxièmement, cette difficulté à gérer des effets va amplifier le désordre car l’énergie du vivant repose sur cette faculté à jouer alternativement de deux pôles complémentaires : stabilité et mouvement de façon à trouver un équilibre

-Troisièmement, pour rétablir l’équilibre de complémentarité rompu, différents facteurs d’ordre vont être développés, proportionnellement au désordre installé

-Quatrièmement, cette fonction sera attribuée de plus en plus à une machine, vue comme plus opérante que l’humain

Il est donc impératif de sortir de l’illusion de la toute-puissance donnée par ces résultats, de les remettre à leur juste place en rappelant que le vivant va bien au-delà d’un jeu de règles définies. En dépassant les limites du corps humain, de l’espace et du temps, les nouveaux champs de connaissances et de techniques doivent appliquer des valeurs de relations non seulement basées sur la quantité mais aussi sur la qualité ; sans oublier les notions de respect et d’humilité. Deux données essentielles que Google DeepMind, emportée par son succès, semble avoir ignorées lors de son utilisation des données de 1,6 M de patients des hôpitaux londoniens posant ainsi la question de la limite du respect de la vie privée.

Bien au-delà des capacités d’AlphaGo, l’humanité a largement l’intelligence pour le faire, à condition qu’elle change de point de vue. Les nombreuses initiatives individuelles ou citoyennes témoignent de notre intelligence à nous adapter face à la nouveauté et à faire évoluer sans cesse un monde qui bouge et que nous efforçons de rendre stable par l’intégration et l’application nécessaires de certaines limites.

 

Simandres, le 6 novembre 2017