Lire hors-ligne :

Hubert Krivine, Comprendre sans prévoir, prévoir sans comprendre (préface de Jean-Claude Ameisen), Paris, Éditions Cassini, 2018, 13 €.

Le saviez-vous ? Il existe une corrélation (assez faible selon les canons de la statistique, mais quand même) entre l’âge des Miss America et les meurtres utilisant la vapeur ou des objets chauds dans ce pays. Ben oui, c’est comme ça. Si cet âge augmente et que vous habitez par là-bas, méfiez-vous encore plus des objets chauds ! Des corrélations de ce type, les sites spécialisés en sont plein. Si vous n’êtes pas encore persuadés qu’il faut en finir avec l’énergie nucléaire, sachez que le nombre de noyades dans les piscines est nettement corrélé à la puissance qu’elles dégagent !

Ce genre de corrélations que rappelle Krivine ne peut qu’augmenter en nombre avec la puissance de calcul brassant les big data. « C’est bien le diable si en choisissant parmi les millions (d’évènements, SJ) répertoriés, on n’en trouve pas un autre qui a, sur quelques années (habilement choisies), une évolution analogue… » nous dit Krivine. Que faire de ces corrélations ? Rien, évidemment. Mais pourquoi ? Parce que, quelque part, on se dit qu’on aura beau se creuser la cervelle, on ne trouvera pas de raison à ces corrélations. Et que (c’est l’un des objets majeurs du livre que de nous en convaincre) sans comprendre ces causes on ne peut le plus souvent trouver aucune utilité à la corrélation mise en évidence.

Alors faut-il ne faire confiance qu’à ce qui fonctionne dans l’autre sens, de la compréhension (avec si on de la chance les modèles théoriques qui les expriment) à la prévision ? Utile y compris si on veut éviter un résultat probable (prévention) ? On sent bien chez Krivine qu’il vaudrait bien mieux être en mesure de répondre « oui » à cette question. En effet, il a consacré déjà plusieurs ouvrages très convaincants à défendre la portée et la puissance de ce mécanisme « descendant », de l’abstrait au concret, comme nous le rappelle ce fin lettré, en s’appuyant sur Hegel et Marx. Mais voilà, toute la connaissance scientifique ne progresse pas sur ce mode, et le livre de Krivine est consacré à explorer les changements que suppose l’exploration des big data, tout en désignant à la critique les extrapolations qu’il juge exagérées (en particulier concernant l’Intelligence Artificielle – IA).

Que faire par exemple d’une donnée que nous apporte l’Inserm avec l’étude d’une cohorte de plusieurs dizaines de milliers de femmes et qui affirme que « Le diabète touche davantage les gauchères et les ambidextres » ? Impossible de tomber sur un tel résultat par un raisonnement « descendant ». Mais le fait (s’il est établi) incite l’Inserm à aller chercher du côté de l’implication de certains gènes et d’hormones. Evidemment, dans ce cas, rien à voir avec la recherche, vaine quoi qu’il en soit, d’une relation entre l’âge des Miss Amercia et les meurtres par vapeur…

Comment alors faire la part des choses ?

 

Quand comprendre ne permet pas de prévoir

Avant de s’attaquer à cette question du lien entre les corrélations statistiques et leur éventuelle compréhension, l’auteur consacre opportunément la première partie de son ouvrage à rappeler que la compréhension ne permet pas toujours la prévision. Déjà les conditions dans lesquelles s’exercent « les causes » doivent être attentivement précisées ; La célèbre et très contre-intuitive conclusion de Galilée indiquant que, quelque soit leur masse, tous les corps tombent à la même vitesse, n’est acceptable que dans le vide. Si de l’air est présent, ça change beaucoup, et Krivine rappelle que « pour un parachutiste cette « approximation » est –stricto sensu – vitale ! ».

De plus on peut être dans des situations parfaitement connues, mais dont le développement dans le temps devient rapidement parfaitement imprévisible. C’est le cas de ce qu’on nomme, d’un oxymore bien trouvé, le chaos déterministe. Aucune « incertitude de type quantique » là dedans : la loi de comportement est claire et peut être d’une simplicité désarmante. Et pourtant on ne sait pas prévoir avec exactitude.

Krivine en donne plusieurs exemples, dont celui du Billard de Sinaï. Un billard banal, avec un champignon circulaire en son centre. La « loi » est celle d’un rebond courant : à chaque rencontre avec le champignon ou avec les bandes, l’angle de réflexion est égal à l’angle d’incidence. Et pourtant, très rapidement, on ne peut plus savoir où sera la boule. Ceci parce que la donnée de départ (l’angle du lancer) ne peut être connue avec une précision infinie et que des écarts infinitésimaux sur cette donnée sont amplifiés de manière telle que même deux incidences de départ, proches à nos yeux, ne donneront pas du tout le même mouvement après quelques rebonds. C’est l’image très connue, mais souvent mal comprise, du battement d’aile de papillon au Mexique qui peut provoquer une tornade au Texas. Aucune place au hasard là-dedans : et pourtant impossible de prévoir.

 

Prévoir sans comprendre ?

L’auteur montre de manière très convaincante que cette « limite » représente en réalité une conquête des mécanismes classiques de l’élaboration scientifique mais sur ses frontières lointaines. Aucune rupture ici. Mais voilà qu’un courant majeur contre balance ces façons de pensée, et annonce même parfois leur remplacement. La puissance de machines aptes à traiter des milliards de données en peu de temps nous dispenserait de « comprendre » tout en nous outillant efficacement. Voire, pour certains, jusqu’à nous remplacer nous-mêmes, êtres pensants.

« Comprendre » nous rappelle l’auteur en revenant à l’étymologie c’est « prendre avec ». Autrement dit « comprendre un événement ou un phénomène c’est être capable de le relier à d’autres qui semblaient sans rapport ». Autrement dit, à un moment « comprendre c’est établir des causalités ».  Peut-on alors imaginer une science qui s’en passerait pour se contenter de constater puis d’utiliser des corrélations ?

Après tout diront des esprits pressés, c’est quand même bien comme cela qu’a procédé la science elle-même, en passant d’observations répétées à des hypothèses qui les systématisent. Mais bien entendu cette position empiriste ne correspond pas au développement réel des sciences. Les mêmes observations répétées du retour du soleil chaque jour sont autant compatibles avec le système de Ptolémée (la Terre au centre) qu’avec des systèmes héliocentriques. Les pommes tombent depuis des millénaires sans provoquer l’éclair de la théorie de la gravitation chez des Newton de la préhistoire. Et les fameuse lois de la relativité (donc le célébrissime E=mc2) ne doivent rien à l’observation directe (puisque déjà dans notre monde quotidien les vitesses sont faibles par rapport à celles de la lumière). Si on devait vraiment passer à la confiance dans le traitement des big data pour en produire des prévisions (sans « comprendre ») il s’agirait bien d’un bouleversement épistémologique majeur.

Qu’en est-il ? Pour se saisir de la question, il faut déjà éliminer les impasses, toutes ces « corrélations illusoires » dont parfois les magasines grand public font un usage immodéré. Pour en venir au fond de la question. Des machines ont effectivement battu les champions d’échec (et les battent désormais encore plus systématiquement), puis ceux du Jeu de Go. On pourrait penser que cela  été réalisé par l’implantation préalable d’un « programme » stratégique pour ce faire, en comptant ensuite sur la capacité de la machine à emmagasiner des sommes colossales de descriptions de parties réelles. Mais ce n’est pas tout à fait cela. Les machines qui ont réalisé ces exploits utilisent un « deep learning », elle apprennent, au sens le plus courant Et, certes avec les expériences passées dont elles sont nourries mais aussi celles qu’elles ajoutent partie après partie, elles élaborent des sortes de modèles internes. Sans options stratégiques préalables. Nul ne sait vraiment à dire vrai ce qu’il en est de l’organisation de leurs mémoires à l’issue de ces processus. Mais… elles gagnent, indubitablement.

Krivine développe ici, à très juste titre, l’idée que pourtant, nonobstant cette puissance, l’intelligence de la machine ne ressemble que de loin à la nôtre, puisqu’elle dédiée à une tâche donnée. Comme il l’indique le champion d’échec Kasparov demeure lui capable de se faire frire un œuf (du moins on le suppose) ce que la machine qui l’a battu ne peut en aucun cas faire. Puisque l’enjeu ici est de discuter le terme même d’intelligence dans « Intelligence artificielle », c’est un argument de poids que développe l’auteur pour montrer que même si on acceptait le terme d’intelligence (et on le sent à juste titre très réticent) elle serait qualitativement différente de la nôtre. Laquelle rappelle t-il, avec des incursions dans les domaines philosophique, biologique, ou liés à l’évolution darwinienne, se combine avec un corps et donc, potentiellement, une relation à l’ensemble de l’univers (et à l’histoire de l’espèce par ailleurs). Ainsi, une intelligence dédiée, fut-elle aussi précise qu’on veut, n’est pas l’intelligence humaine. Sans même aborder les aspects moraux (que Krivine souligne quand même) : peut-être qu’on pourra envoyer des machines combattantes autonomes sur le terrain, mais elles ne régleront sûrement pas l’éternel débat sur les guerres justes ou injustes.

 

Intelligence à hauteur de l’intelligence humaine ?

L’auteur rompt de nombreuses lances contre l’extension abusive des domaines où des machines « dédiées » pourraient utilement remplacer l’intelligence humaine (et ici, sa capacité à modéliser, à « comprendre »). Ce qu’on sait faire pour le jeu de Go, on ne sait pas le faire pour l’économie, pour la sociologie, pour la conduite des affaires humaines en général. Et dit-il, non par limitation des capacités de calcul, mais par nature des cibles. La science se révèle redoutablement efficace quand elle est capable d’isoler son objet du reste du monde et de séparer d’une manière suffisante le sujet qui mène la recherche de cet objet. Même là ce n’est pas toujours aussi simple ! Mais c’est évidemment encore bien plus compliqué, inaccessible en fait, pour les domaines des sciences sociales (sciences « historiques » dans la formulation de Passeron).

La machine pourra t-elle par ailleurs simuler suffisamment les relations corporelles humaines avec l’univers ? Pourra t-elle,-même avec du deep learning, atteindre une prévisibilité, une efficience, dans les choix guidant les conduites humaines s’élevant ainsi au rôle de concurrent, et bientôt de domination de l’espèce qui l’a créée ? On touche là aux terreurs décrites par les auteurs de science fiction, et, surtout, aux craintes bien réelles touchant aux libertés individuelles et collectives. Mais si ce dernier risque ne doit en aucun cas être négligé, Krivine montre qu’en l’état on est loin d’une « intelligence », et, puisque définir ce terme est presque impossible, disons d’une intelligence comparable à la nôtre. Il ne faut pas ici se laisser prendre aux métaphores (par exemple l’utilisation de termes comme « neurones » dans les deux cas).

Les big data révolutionnent effectivement des domaines entiers du savoir. Sans eux, pas de mise en évidence du boson de Higgs, pas d’aide à la météo, pas de progression dans la mise en évidence de corrélations insoupçonnées en médecine ou en pharmacologie. Progression dédiée, deep learning aussi bien, acquis maintenant leur principe, dans nombre de domaines. Celui de la reconnaissance faciale par exemple. Au profit de qui et de quoi est une vielle question que Krivine aborde, avec une réponse classique (mais peut-il vraiment y en avoir une autre ?) de la distinction entre l’outil et celui qui s’en sert. Après tout un tournevis aussi peut se révéler une arme mortelle.

Mais il insiste sur un point capital. Au final, tout ceci ne dispense pas de la tension vers la compréhension. Ainsi il est prouvé (et prouvé encore, ad nauseam) qu’il y a une corrélation négative forte entre la couleur noire de la peau et le succès scolaire aux Etats Unis. Mais certains y cherchent une « compréhension » par une causalité « génétique », donc héréditaire, donc fatale. Quand d’autres en chercheront les racines systémiques socio-politiques. Pas la même chose nous dit Krivine, dont tout le livre est tourné contre la paresse de la pensée qui accompagne les discours apologétiques sur l’IA.

 

Comme toujours dans ses productions, voilà un livre fort de Hubert Krivine. Et, il faut le signaler pour chasser les évitements, encore plus accessible aux non initiés que les précédents. Aisé donc à « comprendre » ! Ajoutons que le livre est préfacé d’une manière forte et importante quant aux thèmes abordés par une plume fameuse, Jean-Claude Ameisen, celui-là même qui anime les célèbres émissions « Sur les épaules de Darwin » sur France Inter. Au final, une excellente lecture de vacances ; ou pour après : en tout cas à ne pas rater.

 

Lire hors-ligne :