Frédéric Amétisse


Réponse définitive à la question de la créativité et de l’art dans l’Intelligence artificielle

The monolith 2001

L’intelligence artificielle fait débat et fascine. Je pense qu’une grande partie de sa fascination, est due au fait qu’elle est un mythe de narcisse. Non seulement pour l’irrationalité qu’elle suscite face à son côté impressionnant qui dans l’imaginaire de certains (notamment les journalistes et leur côté sensationnalisme) a un effet “science-fiction qui se réalise”, mais aussi au questionnement même de ce qu’est l’intelligence. Effectivement, il n’est pas rare d’entendre de nos jours : “bientôt on n’aura même plus besoin de réfléchir.” Car dès le début ces mots intrigues : “Intelligence” et “artificielle”.

Ainsi, nous, les grands êtres humains, grâce à la puissance de calcul incroyable des ordinateurs les plus récents, que nous avons inventés, fabriqués. Grâce à notre plus haut niveau de science, d’avancées technologiques, grâce à nos plus grandes découvertes, de l’élaboration mécanique des réseaux de neurones que nous pouvons simuler. Nous la grandeur scientifique absolue, nous allons pouvoir engendrer, fabriquer, récréer le cerveau humain, que dis-je : un cerveau entièrement électronique. C’est-à-dire l’intelligence même. C’est ainsi que les ordinateurs vont pouvoir se mettre à penser, à réfléchir, pour la société de demain, la révolution humaine : le créateur.

Cette longue phrase exagérément satirique se retrouve malheureusement être parfois entendue comme une sorte de leitmotive premier degré pour féliciter les progrès de l’informatique… Et que le but serait la fabrication de l’esprit et la pensée, mais en vérité savons-nous seulement ce qu’est penser ?

The monolith 2001

Le milieu du marketing prend un malin plaisir à inventer des mots qui n’ont que peu de rapport avec le sujet initial pour ainsi essayer de déformer la réalité. Pour illustrer ce propos, il existe un mot du même type dans le domaine de l’informatique, c’est le mot “cloud”, ou “nuage” en français. Tout le monde le sait, cela ne veut pas dire grand-chose, on est bien au courant que les ordinateurs n’existent pas dans les nuages… Cela est une sorte de concept marketing pour jouer sur les mots, flouter les concepts, pour pouvoir ainsi berner l’utilisateur sur le produit final à vendre. Car le but du marketing est toujours de vendre toujours plus. Le “cloud” en vérité désigne plus ou moins un ensemble de techniques de virtualisation et “clusterisation” pour déployer sur de larges échelles, donc sur plusieurs serveurs, mais en réalité le mot est tellement pris à toutes les sauces qu’il n’a plus vraiment de sens. Mais a t-il eu vraiment un sens ? Car ce mot ne possède d’existence qu’uniquement sur le plan marketing c’est-à-dire en tant que produit. Le but est bien entendu de pouvoir jouer sur ce flou pour pouvoir vendre tout et n’importe quoi, c’est donc une stratégie marketing.

Une autre approche de stratégie, car rappelons que le marketing est toujours et uniquement de la stratégie, est de personnifier un produit pour essayer de le rendre plus attractif, plus “humain” et donc de jouer sur le plan émotionnel. Un exemple serait “IBM Watson”, lorsque l’on fait des recherches sur le sujet de Watson, on a tendance à croire que l’on parle d’une personne, un programme avancé, futuriste, technologique, qui permettrait des révolutions dans le domaine de l’I.A. En vérité, c’est juste le nom d’une succursale d’IBM qui vend toutes sortes de produits et sous-produits dans la catégorie I.A et dont tous sont faits sur-mesure. On aperçoit donc bien l’aspect marketing qui joue sur les limites de la science-fiction donc de l’imagination factice, et qui se confond avec le véritable aspect technique, pour attirer ceux qui ne sont pas doués d’esprit de différenciation.

Cet aspect marketing de l’intelligence artificielle est donc du domaine de l’imaginaire (mais d’un imaginaire faux, délirant, qui induit en erreur) ce n’est pas de la technique (Teknè au sens que Platon le définirait dans le Ion). Et n’a d’ailleurs rien avoir l’intelligence humaine. Je pense même que cela devrait être considéré comme une insulte envers l’humanité. Mais le fait que la confusion puisse exister et voir même exciter certaines personnes est intéressant, voyons pourquoi.

Intelligence artificielle, qu’est-ce qui se cache derrière ces mots ? Quelle est son essence ? En vérité, la chose est beaucoup plus simple qu’on ne le croit. C’est tout simplement un programme informatique. Ou plutôt un type d’algorithme informatique bien spécifique. On devrait l’appeler : algorithme de statistique avancé, car effectivement, il met en avant des notions particulières de statistique avancée. Mais avant de se pencher sur cela, faisons un bref résumé de ce qu’est l’informatique au sens de qu’elle est son essence ? Comment-est il possible que nous puissions demander à la machine d’exécuter des fonctions ? Et comment se fait-il que cette machine puisse nous “répondre” ?

L’invention du Transistor (1947) a permis à l’être humain, en triturant la matière (l’organisant), de pouvoir créer des portes-logiques, c’est-à-dire de pouvoir exécuter des opérations logiques (booléennes: vrai/faux) de plus en plus petites, et c’est ainsi qu’est né le circuit intégré (1958) donnant naissance au premier microprocesseur (1969).

Les transistors possèdent trois broches, des pattes métalliques sur lesquelles on connecte des fils électriques. On peut appliquer une tension électrique sur ces broches, qui peut représenter soit 0 soit 1. Sur ces trois broches, il y en a deux entre lesquelles circulent un courant, et une troisième qui commande le courant. Le transistor s’utilise le plus souvent comme un interrupteur commandé par sa troisième broche. Le courant qui traverse les deux premières broches passe ou ne passe pas selon ce qu’on met sur la troisième. [https://fr.wikibooks.org/wiki/Fonctionnement_d%27un_ordinateur/Les_transistors_et_portes_logiques#Les_transistors_MOS]

Il n’y a rien de compliqué dans cela. Il faut voir les portes-logiques comme des interrupteurs miniatures qui selon des conditions que nous avons décidés renvoient des résultats. Ces interrupteurs ont été miniaturisés au format de l’électronique et de la microélectronique ce qui donna naissance au microprocesseur. Rappelons qu’un microprocesseur moderne contient plus de 13’100 millions de transistors (essayez d’imaginer autant d’interrupteurs).

Il y a là une révolution qu’on ne souligne pas assez, c’est la capacité à avoir réussi à organiser la matière, je parle donc bien de matière inerte au sens mécaniste du terme, pour qu’à partir de cette matière même, on puisse lui donner une entrée et qu’elle nous donne en retour une sortie. C’est exactement ce qu’est la fonction mathématique f(x). Il est important de souligner l’aspect mécaniste au sens où les premières calculatrices ou machines d’arithmétiques telles que la pascaline, étaient simplement des boites sur lesquelles on tournait des rouages avec des chiffres ce qui permettait en entrant ces chiffres (entrée) d’avoir un résultat immédiat (sortie) tel que l’addition, la soustraction et la multiplication. C’est exactement la même chose avec l’électronique moderne sauf que l’interaction avec la matière est beaucoup plus subtile et infiniment plus petite, et le travail des rouages mécaniques est remplacé par celui des portes-logiques.

Pour illustrer cela prenons une famille très courante de microprocesseurs (les x86) et regardons deux instructions en langage machine (l’assembleur) que tout le monde peut comprendre, la fonction ADD qui permet de retourner la somme de deux entiers (addition), et la fonction SUB qui permet de soustraire deux entiers (soustraction). Elles sont directement inscrites au coeur du microprocesseur sous forme de portes-logiques. Il suffit d’envoyer des données au microprocesseur pour obtenir le résultat. Évidemment, dans la vie réelle tout n’est pas aussi simple. Il faut prendre en compte la mémoire, ainsi que pleins d’autres problèmes “bas niveau” avec lesquels des personnes qui ne sont pas ingénieurs ou spécialistes du domaine ne peuvent tout simplement pas interagir de manière simple et accessible. Mais l’émergence de l’informatique a donné naissance au système d’exploitation (comme GNU/Linux, Windows ou macOS). Il faut voir cela comme un ensemble de surcouches qui permettent de simplifier l’accès à la machine grâce notamment aux langages de programmation. Ces langages sont des ensembles d’instructions en général proche de l’anglais qui vont tout simplement être traduits en langage machine (le langage du microprocesseur) et donc de faciliter l’accessibilité de l’utilisateur pour programmer sa machine et ainsi donner l’accès à des interfaces utilisateurs, accessibles pour tout un chacun.

C’est ainsi qu’on peut afficher du texte, des interfaces graphiques et de faire toute sorte de chose qu’aujourd’hui nous utilisons quotidiennement sans même nous rendre compte de comment cela fonctionne et sur quoi cela repose. Ce n’est donc pas de la magie, ni du hasard, non plus de la chance, mais bien des siècles de réflexion, de philosophie, de mise en pratique, de réalisation, bref de savoir humain qui nous ont menés à l’élaboration de ces pures machines au sens mécanique du terme.

Il est vraiment important de préciser que tout cela est de la pure matière, de la pure physique, que nous avons manipulée (au sens de dévier de sa fonction initiale) physiquement pour arriver au résultat que nous avons décidé. Il n’y a là rien de plus rationnel. On le sait, l’essence de l’informatique est rationnelle, c’est de la pure matière isolée qui produit des résultats que nous lui imposons comme l’est une machine.

Mais une machine dans laquelle nous inscrivons des choses, ces choses nous appartiennent. Effectivement, nous interagissons avec de la matière pure et cette matière pure est un “écran interactif” de notre propre esprit (comme l’est l’écriture). L’encre de l’écriture ainsi que son support (ce qui fait l’essence de l’écriture en tant que technique) n’a rien avoir avec le sens de l’écriture, ce qui est du domaine du sujet qui interagit avec le support technique, c’est-à-dire l’être humain. Ainsi lorsque nous utilisons un appareil technique moderne (ordinateur, smartphone) le sens de cette interaction n’a pas plus avoir avec son support, si j’écris un mot dans un éditeur de texte, le sens de ces mots n’a rien avoir avec le support. De même que les interactions physiques à l’intérieur des transistors n’ont rien avoir avec les différents algorithmes qui ont été rentrés dans la machine (et par ailleurs décidés par l’être humain, le sujet, le programmeur) pour afficher, ou exécuter telle ou telle fonctionnalité, avec laquelle nous interagissons. Effectivement, quand nous écrivons le mot “fleur”, nous savons très bien que le mot : “fleur” n’est pas une fleur, de même qu’une photo de fleur sur un écran n’est qu’une représentation imagée d’une vraie fleur, que cette fleur ait été dessinée ou photographiée…

En effet, on comprend vite que le problème qui est suggéré par l’intelligence artificielle (qui est le problème de la créativité ou de la faculté de réflexion au sens du miroir, “qui pense ?”) cela est en fait un vieux problème déjà maintes fois traité et résolu par plusieurs disciplines. Malheureusement, la conclusion vers laquelle ils tendent a tendance à déranger fortement, nous allons voir en détail pourquoi, mais avant cela, regardons comment un artiste : René Magritte a su faire face au problème de ce que l’on pourrait appeler “le problème de l’isomorphisme entre support et représentation”.


dessin de René Magritte - Les mots et les images


Parfois le nom d’un objet tient lieu d’une image.
Un mot peut prendre la place d’un objet dans la réalité.
Une image peut prendre la place d’un mot dans une proposition.
Un objet fait supposer qu’il y en a d’autres derrière lui.
Tout tend à faire penser qu’il y a peu de relation entre un objet et ce qui le représente.
Les mots qui servent à designer deux objets différents ne montrent pas ce qui peut séparer ces objets l’un de l’autre.
Dans un tableau les mots sont de la même substance que les images.
On voit autrement les images et les mots dans un tableau.
Un ojet ne fait jamais le même office que son nom ou son image.
Les contours des parties d’objets que nous voyons dans un la réalité se touchent comme si ces parties formaient une mosaïque.
Les figures vagues ont une signification aussi nécessaire, aussi parfaite que les précises.
Parfois les noms écrits dans un tableau désignent des choses précises et les images des choses vagues. Ou bien le contraire.

Tout cela est le propre du langage et la capacité de projection de l’être humain. Cette capacité est étroitement liée au concept de projection que l’on retrouve dans la psychologie. C’est un sujet vaste et complexe au sens où il est étroitement lié aux différents complexes de l’être humain, c’est-à-dire sa psychée.

C’est ainsi qu’on peut comprendre le parallèle avec le mythe de Narcisse. Être fasciné par la réflexion, c’est-à-dire le miroir de soi-même (et ses propres complexes et instincts) dans la matière extérieure. Au fond ce que l’on regarde ce n’est que nous-mêmes, notre esprit qui se réfléchit dans la matière inerte du monde, notre propre structure psychique, notre instinct humain qui certes, n’est heureusement pas limité à l’égo. Il serait peut-être judicieux de mettre en avant cet esprit et ses possibilités, son équilibre, son processus dynamique plutôt que “d’essayer de se noyer dans la maya”, l’illusion de la matière formelle, et donc la forme, et tous les déboires que cela peut créer.

Mais alors pourquoi l’intelligence artificielle a réussi à créer des choses qu’auparavant nous étions incapables ? Ce n’est qu’une histoire de programmation et d’algorithme. En effet, les algorithmes de statistiques avancés reposent sur un principe très différent de la programmation classique que l’on retrouve dans les ordinateurs. La programmation “classique” consiste à créer un nombre d’instructions à la suite pour dire à l’ordinateur ce qu’il doit faire de manière méthodique et déterministe. Alors que la méthode statistique du “machine learning” est tout autre. Elle consiste à confectionner manuellement une immense base de données du résultat à obtenir, comme par exemple des millions de photos de chat, d’entrainer un algorithme de statistique avancé à prendre les bonnes décisions sur ces milliers d’informations, comme par exemple trouver une manière de reconnaitre un chat, pour qu’une fois que le résultat de la fonction possède un taux de pourcentage vrai satisfaisant, l’utiliser comme fonction de retour. Ainsi l’algorithme est considéré comme “entrainé”. On peut ainsi lui soumettre des photos de chat qui n’appartient pas à sa base de données initiale et il sera capable statistiquement de répondre avec un taux de pourcentage qui on l’espère soit correct. Bien qu’il soit puissant c’est un algorithme qui demande de colossales ressources de données (de travail), de calcul, de puissance donc d’électricité et peut donc induire un grand gaspillage. Autant chercher à reconnaitre des photos de chat n’a pas vraiment d’utilité, un algorithme ne peut pas être “mal” sauf si le cas de son utilisation est absurde et qu’il consome par exemple une quantité énorme d’énergie pour un résultat qui ne sert strictement à rien… Ce type d’algorithme est très différent de la programmation classique, et il y a sûrement des tas de cas d’utilisation où il peut montrer son plein potentiel.

Malheureusement un des problèmes de ce type d’algorithme est que considéré sous une forme de fonction f(x) (pour l’exemple) le résultat du machine learning n’est pas déterministe. Il faut voir cette fonction comme une boite noire qui provient de l’entrainement statistique. Il suffit de proposer en entrée une information qui n’a jamais été “entrainée/considérée” par la base de donnée du réseau statistique pour avoir des résultats parfois complètement “délirant” et “hallucinant”. On peut d’ailleurs beaucoup jouer sur ce plan là, voir cette étude. Ce qui ne rassure vraiment pas du tout quant à la question d’une “intelligence artificielle” pour l’aide à la conduite. Sans parler du cas où certaines personnes se mettent à croire à ce que disent les LLMs (Voir cette étude)

Mais la question initiale que posait cette article était la capacité de créer du nouveau, donc de la question de la créativité, de l’intuition et donc de l’art dans l’intelligence artificielle. Nous l’avons vu, l’intelligence artificielle n’existe pas, autrement qu’en tant que terme marketing pour “vendre” un type d’algorithme qui est sûrement utile et puissant dans certains cas, mais qui est pour d’autres cas tout simplement une usine à gaz de complexité lourdre et polluante. En descendant petit à petit dans les détails, en trouvant l’essence de l’informatique, de l’algorithmique et de la statistique avancée, nous avons pu différencier les différentes choses qui se jouent ici. Un algorithme statistique qu’il soit d’ailleurs statistique ou non, ne crée rien, il pioche dans sa base de donnée entrainée et emprunte des morceaux de toutes parts. Il est important de se rapeller que ces morceaux appartiennent à une autorité, que le droit d’auteur s’y applique et que souvent ces bases de données ne sont pas du tout légales. Un enjeu éthique important s’y joue ici, surtout que l’on ne parle pas simplement de licence de code informatique (donc d’une créativité formelle) mais bien d’une autorité créative artistique comme pour l’exemple des générateurs d’image. Ces algorithmes utilisent des immenses bases de données dans lesquelles on retrouve des artistes, des peintres, qui eux ont procédé à un véritable cheminement dynamiquement créatif pour qu’ils puissent arriver à leurs oeuvres. Cela change un homme, le créateur, mais change aussi le spectateur. Il est important de considérer cela vu que l’on parle ici de structure psychique humaine. Un algorithme n’est pas la structure psychique humaine, il est créé formellement par la structure psychique humaine. Là est la différence.

Et effectivement cela n’enlève en rien que dans n’importe quel domaine créatif, piocher au hasard des images dans des livres et les mélanger peut faire fructifier l’imagination. Je me rapelle même avoir entendu le dessinateur Jean Giraud (Moebius) concernant la conception des personnages de l’Incal dire que Jodorowsky fermait les yeux prenait des livres d’images les ouvrait au hasard et disait : “voila c’est ça”. Bien que cette pratique peut paraître “folle” elle met en marche notre monde imaginaire, dans notre psychée. Et donc utiliser des prompts hasardeux ou non pour essayer de générer une image que l’on a dans la tête peut être un moyen de faire fructifier formellement notre imaginaire mais il ne faut pas oublier que cet objet formel provient de la créativité humaine, c’est-à-dire d’une opération créative dans laquelle l’artiste a dû confronter forme et imaginaire, cette opération n’est pas simple et je dirais même que c’est là tout l’enjeu artistique. Il est important d’opérer cette différenciation car là est la question de l’art, plus qu’une question, là est l’instinct vivant, et vivifiant de l’art.

La créativité est une forme d’intuition (à l’état latent) et quand elle se formalise, c’est cette intuition même qui permet de rendre le sens du formalisme. Ce formalisme en tant que tel n’est pas la créativité, cela se joue autant sur le plan graphique, des formes artistiques les plus folles que dans les mathématiques les plus rigoureuses. La dynamique de la structure psychique ne change pas selon les mediums. En effet rapellons nous de ce qu’un grand et très rigoureux logisticien nommé Kurt Gödel a dit à propos du formalisme mathématique (vous pouvez entendre la forme extérieure du sens, artistique et mathématique) :

“Du fait que les énoncés s’avèrent irréductibles à la démontrabilité du système, c’est-à-dire l’entière objectivité, et projection du dit système. Cela soulève la question d’une conscience réflective et de l’irréductibilité de l’esprit à une machine. Il en vient logiquement à doter l’esprit de qualité supérieure, car si le vrai n’est pas intégralement formalisable, l’esprit doit en avoir l’intuition, faute de quoi la vérité nous échapperait.”