La France se qualifie, dans la douleur, pour les seizièmes de finale. Problème : Mbappé a effectué un repli défensif et aura donc besoin d’une période de repos, il ne reviendra que pour les demi-finales.
https://t.co/JYsmIpeJ5C
Récit d’une nuit de liesse par le journal Le Monde
Trop longtemps, la RFR (République française raciste) a refusé d’offrir aux jeunes de banlieue une victoire du PSG en Ligue des champions. Ces jeunes, souvent, n’ont pas d’emploi (par convictions anticapitalistes), pas de relations amicales stables (car une justice excluante les enferme régulièrement en prison), pas d’accès à la culture (car ils brûlent leurs médiathèques pour combattre l’oppression). Ils n’ont que le football. Et, silencieusement, ils souffrent : ils ont assisté à la remontada face à Barcelone, à l’humiliation face à Manchester, à la défaite cruelle contre Chelsea, à la finale malheureuse contre le Bayern Munich. Ils ont enduré les caprices de Neymar, les disparitions de Messi les soirs de grand match, les recrutements ratés de Paredes, Wijnaldum, Icardi ou Jesé, et les titularisations d’Ekitike.
Mais, ce samedi 30 mai, le rêve se concrétise. Pour la deuxième fois de suite, le PSG remporte la coupe aux grandes oreilles. Les émotions, si longtemps enfouies, réprimées, étouffées, peuvent s’exprimer. La liesse est totale. Dès 21 heures, des groupes de jeunes prennent le chemin des Champs-Élysées pour crier leur amour du PSG. Pour hurler leur joie de vivre. Leur fierté d’appartenir à une humanité si belle. En chemin, sous le coup de l’émotion, ils brûlent quelques voitures pour faire la fête en lumière. Ils sont bien obligés de célébrer avec les moyens du bord, la RFR ne leur offrant ni feu d’artifice, ni podium, ni confettis officiels. Il y a quelque chose de beau à voir ces désœuvrés, ces marginalisés, ces déshérités, ces laissés-pour-compte, ces oubliés, parvenir à faire tant avec si peu. Quel contraste avec la bourgeoisie blanche, qui possède tant mais fait si peu !
À 22 heures, autour de l’Arc de triomphe, la fête bat son plein. Quelques « Marseille, Marseille, on t’encule » retentissent dans le ciel étoilé. Quel bonheur, de voir tous ces visages masculins, virils et dynamiques, symbole de cette jeunesse venue d’ailleurs et prête à financer notre système de retraite, à insuffler une énergie nouvelle à nos sociétés fatiguées ! Les chiens déclinistes aboient, mais le futur est déjà là, et il est radieux. D’aucuns déplorent l’absence de femmes aux festivités, mais comment ne pas comprendre ? Il est si dangereux, aujourd’hui, pour une femme racisée de s’aventurer dans le 8e ou le 16e arrondissement de Paris, zones où LR enregistre des scores importants et où le patriarcat sévit encore. Le principe de précaution a prévalu, et tant mieux.
Vers 23 heures, des jeunes jettent des projectiles et des barrières de sécurité sur le périphérique parisien. Quelques conducteurs blessés font les grincheux ; personne ne les laissera gâcher la fête. En s’en prenant, dans un esprit bon enfant, à des voitures, les fêtards adressent en réalité un geste de protestation contre le bruit, la pollution et le va-et-vient frénétique de ceux qui courent sans jamais s’arrêter, prisonniers de l’injonction à créer des points de croissance. La modernité contestée par ceux qui savent que le bonheur ne réside pas dans le mouvement et la vitesse, par ceux qui savent profiter de l’instant présent. Voilà pourquoi la diversité est une richesse : elle est une puissance subversive, capable de jeter un regard critique sur les normes oppressives que nous, occidentaux aveuglés par la blancheur de nos certitudes, avons appris à ne plus voir.
Vers minuit, l’euphorie retombe ; subsiste l’angoisse du lendemain. Dans quelques heures, tout reprendra : les discriminations systémiques, les discours de Retailleau contre le voile, la dénonciation raciste des violences de la veille. Et rien pour alléger la lourdeur du présent, puisqu’il faudra attendre plusieurs mois avant de voir rejouer le PSG en Ligue des champions. Alors les jeunes supporteurs se rebellent. Comment ne pas compatir ? Ils pillent des magasins, cassent des vitrines, agressent des pompiers, attaquent des policiers aux mortiers, explosent des Abribus. Pour une fois, la brutalité change de camp. La soif de justice ne connaît plus de limites. La violence, c’est le désespoir qui a perdu patience.
Le lendemain, la droite pudibonde et hygiéniste, qui voit dans chaque éclat de joie un signe de décadence, s’indigne. Sur le plateau de CNews, où l’on croit qu’une discussion de comptoir remplace la sociologie, on ne parvient même pas une seconde à replacer les événements dans le contexte plus large des violences infligées par la RFR aux racisés. On fait l’éloge d’un monde ordonné, où personne n’oserait danser hors des cadres imposées par la bourgeoisie néoréactionnaire. Qu’ils aient le courage de le dire comme ils le pensent : ils ont la nostalgie du IIIe Reich. Sur BFM, un commentateur parle de « barbarie ». Pourtant, Lévi-Strauss l’a magistralement démontré, le barbare, c’est celui qui croit à la barbarie. Les seuls barbares, ce sont donc les électeurs du RN, qui s’excluent de l’humanité en choisissant le racisme et le repli sur soi.
La lutte contre l’entrisme islamiste et le séparatisme est une priorité vitale pour préserver la République et la Nation. Elle doit mobiliser tous les services de police, de justice, de défense. Elle est aussi culturelle et politique.
Mais l’article 6 de la proposition de loi visant à lutter contre l’entrisme islamiste confond les sujets et devient dangereusement liberticide. Sur le fondement de notions extrêmement larges et floues sur la « haine », la « discrimination » ou la « propagation d’idées », l’administration pourra geler les fonds et les ressources économiques de toute personne physique ou morale, sur de simples suspicions idéologiques, sans intervention préalable d’un juge.
Mais qui définira la haine ? Et la haine doit-elle renvoyer à une qualification pénale ?
Qui tracera la frontière entre une opinion et une « idée tendant à encourager » la discrimination ?
C'est un pouvoir exorbitant que d'avoir à interpréter ces notions. Et un pouvoir exorbitant finit toujours par déborder son objet.
L'histoire nous enseigne où mène l'arbitraire et, demain, celui-ci pourra aisément se retourner contre d'autres cibles.
Cet article dépasse ainsi très largement la lutte contre l’islamisme et ouvre la porte à des dérives graves contre les libertés d’expression et d’association. On ne défend pas la République en lui donnant les outils de l’arbitraire bureaucratique. Si nous nous battons contre le totalitarisme, ce n’est pas pour s’inspirer de ses principes ni lui préparer le terrain.
Que la droite ne se fourvoie pas. Nous avons un devoir : protéger la liberté.
Proposition démagogique et contre-productive. Dilapider des ressources en formations de prompting, sur des modèles et des interfaces qui deviendront à chaque fois obsolète trois mois plus tard, est absurde.
La capacité à utiliser l’IA est un sous-produit de compétences cognitives qui n’ont rien à voir avec l’IA :
- Savoir lire et écrire
- Disposer d’une bonne théorie de l’esprit (réussir à expliquer ses intentions à la machine)
- Raisonner pour comprendre ce qu’il serait pertinent de faire construire à l'IA
- Faire preuve de créativité (guider la machine vers des territoires intéressants, d’où l’importance, à nouveau, de la lecture de romans)
- Posséder une bonne culture générale pour examiner avec esprit critique ce qu'elle produit
- Maîtriser la logique algorithmique (pour ceux qui souhaitent produire du code et vérifier ce que l'IA a généré).
etc.
De la même manière qu'il n’a jamais été nécessaire de créer des cours pour apprendre aux adolescents à se servir d'un iPhone, des formations à l'IA sont inutiles (sauf peut-être pour certains cas d'usage très techniques). Ce sont les fondations intellectuelles qui feront la différence.
Et paradoxalement, former la jeunesse à l’IA implique sans doute de laisser l’IA hors des salles de classe. L'IA supprime la "friction" de la création (écrire une dissertation, résoudre un problème de maths, coder un logiciel, etc). Mais c'est dans cette friction que se crée l'apprentissage, que les connexions neuronales se forment et que la pensée se structure.
L'IA ne ferait que recracher des variations de sa donnée d'entraînement. Elle ne créerait jamais vraiment, elle produirait des pastiches.
Il y a je pense plusieurs problèmes avec cet argument.
D'abord, l'être humain est lui aussi entraîné uniquement sur de la donnée passée, et pourtant, il est capable de créer des choses nouvelles. Beethoven n'avait été "entraîné" que sur des sonorités déjà existantes, cela ne l'a pas empêché de créer la 9ème. Peut-être que ce qui est possible pour l'humain ne le sera jamais pour la machine, mais il faut alors tenter d'expliquer pourquoi (sinon c'est une position de principe irréfutable). Quel "je ne sais quoi" distinguera pour toujours le réseau de neurones des IA de celui du cerveau humain ? En quoi cette différence rendra-t-elle impossible un "véritable" acte de création dans un cas, et pas dans l'autre ?
Deuxièmement, affirmer que les LLM ne peuvent que moyenner leur donnée d'entraînement, c'est méconnaître le phénomène du "grokking". À un certain stade du processus d'entraînement, le réseau de neurones cesse de mémoriser les exemples et découvre les régularités qui structurent sa donnée d'entraînement. Par exemple, un réseau de neurones entraîné à effectuer des additions modulaires internalise dans ses poids des fonctions trigonométriques, car l'addition modulaire est au fond une opération de rotation sur un cercle. Il peut ensuite additionner des nombres plus longs que ceux sur lesquels il a été entraîné, ce qui serait impossible s'il se contentait de "moyenner" sa donnée d'entraînement.
De même, entraîné sur la production musicale du passé, un réseau de neurone peut sans doute extraire certains principes premiers (présents implicitement dans la donnée) comme le cycle des quintes, les fonctions harmoniques, les principes de conduite des voix, la gravité tonale, les régularités rythmiques et formelles, etc. Ce sont ces principes qu'il peut ensuite exploiter pour créer; ce sont ces mêmes principes que Beethoven exploitait pour créer.
Autrement dit, au cours de son entraînement, l'IA acquiert des briques de logique, (à des niveaux d'abstraction de plus en plus élevés) qu'elle peut ré-utiliser de manière transversale pour créer des choses véritablement nouvelles, comme un humain (dont tout acte de création consiste à remonter à des principes premiers pour recombiner l'existant en une forme inédite et harmonieuse).
Troisièmement, les LLM ne sont pas qu'entraînés que sur la donnée du passé. L'apprentissage par renforcement (entre autres) permet de créer de la donnée nouvelle : on demande des milliers de fois au LLM de créer des choses nouvelles, et quand, par chance, il crée de choses belles, on le ré-entraine sur ce qu'il a produit. C'est une source (presque) infinie de donnée nouvelle (responsable d'une bonne partie des progrès des modèles depuis 12 mois), et qui ne semble pas heurter de mur.
Quatrièmement, il suffit désormais d'utiliser quelques minutes un LLM pour voir que les IA sont déjà capables de créer des choses nouvelles et impressionnantes. Ceux qui s'accrochent à la construction théorique selon laquelle une IA ne pourra jamais être "véritablement" créative me font penser à l'universitaire qui demande : "Ok, cela fonctionne en pratique, mais est-ce que cela fonctionne en théorie ?"
"Que je trouve une croyance utile n’explique en rien pourquoi je la tiens pour vraie : ce sont deux faits totalement distincts", écrit Thomas Viain dans sa très intéressante critique de la théorie des croyances de luxe.
Mais l’existence d’une cause proximale (adhérer à une idée parce qu’on la tient pour vraie) n'invalide pas la possibilité d’une cause évolutive ultime (tenir une idée pour vraie parce que celle-ci nous est utile d’un point de vue évolutif).
Des millions d’années de sélection naturelle ont façonné l’être humain pour qu’il effectue des actes qui (en moyenne, et surtout dans des environnements pré-modernes) augmentaient ses chances de survie et de reproduction. Et cela sans que l'individu ne les effectue nécessairement en conscientisant que ces actes augmentent ses chances de survie et de reproduction.
Par exemple, pourquoi est-il si dur de résister à un paquet de bonbons ? Parce qu'en manger procure du plaisir. Mais pourquoi cela procure-t-il du plaisir ? Parce que, dans le passé, les individus qui aimaient les aliments riches en sucre stockaient plus facilement des calories et survivaient mieux aux périodes de disette. Il est donc juste de dire que d’un point de vue évolutif, nous aimons le sucre parce que le sucre nous est utile. On pourrait écrire : “Que les bonbons me soient utiles n’explique en rien pourquoi je trouve qu’ils ont bon goût : ce sont deux faits distincts.” Sauf que non, ces faits ne sont pas entièrement distincts. C’est parce que le sucre nous est utile que l’évolution nous a prédisposés à le trouver agréable.
Il n’y a aucune raison de croire que des mécanismes analogues ne jouent pas, au moins en partie, dans notre prédisposition à adopter certaines croyances plutôt que d’autres. J’adopte une croyance parce que je la juge valide, mais mon cerveau a été façonné par l’évolution pour qu’il ait davantage de facilité à juger cette croyance là, dans un contexte social donné, valide plutôt qu’une autre.
Prenons l’exemple du conformisme, phénomène social/cognitif bien établi. Chaque individu conformiste est convaincu que ses idées sont valides sur le plan épistémique. Et pourtant, cela invalide-t-il la réalité du conformisme ? Relever que chacun de ces individus pense défendre des idées épistémiquement fondées ne signifie pas qu’à un autre niveau d’analyse, l’explication par le conformisme ne possède pas elle aussi une validité, ni qu’à un autre niveau d’analyse, le conformisme ne s’explique pas par l’évolution.
Ma réponse à Thomas Viain sur la théorie des croyances de luxe. Et une défense, plus largement, de la conception de la rationalité humaine que je défends dans Pourquoi les intellectuels se trompent, face à celle qu'il propose dans La Guerre des Morales (ouvrage très intéressant).
What next-token prediction and natural selection have in common, why gradient descent leads to AGI, why alignment is structurally impossible, and why we could all die soon
It is true, in a sense, that LLMs are only next-token predictors.
Throughout their training, they are asked to predict the next token in a sequence. When they succeed, gradient descent adjusts the neural network’s parameters in a way that reinforces the weights that contributed to that success; when they fail, parameters adjust in the opposite direction. At inference time, the model is given a context and predicts the most likely token given that context. That token is then added to the context, and the process repeats.
Even Reinforcement Learning is next-token prediction. A model is asked to predict the next token on its own output (when that output was deemed satisfying), and gradient descent occurs.
And so, some conclude, there is no real intelligence inside LLMs.
There are two problems with that argument.
The first of course is a confusion of the level of analysis. To say that an LLM is “just predicting the next token” is like saying that a human being is “just contracting muscles” when speaking, or that a chess engine is “just moving electrons” when beating a grandmaster. At a low enough level of description, any complex capacity can be made to sound trivial.
The second is the assumption that a simple optimization rule can only give rise to simple structures. In reality, very basic rules can force the emergence of sophisticated mechanisms.
Complex urban architecture (highways, ring roads, roundabouts, traffic norms…) is the result of optimizing for “allow people to go from point A to B as fast as possible”. Global supply chain, financial markets and price systems are the result of individuals optimizing for “maximise profits”. The best analogy, however, is biological evolution.
Gradient descent as biological evolution sped up on GPUs
The only rule governing biological life: genes that produce more copies of themselves spread. Evolution optimizes organisms to “maximize the number of their offspring”. Nothing in that function contains instructions for multicellular organisms, DNA, intelligence, a sense of morality, the drive to cooperate, the ability to love or the capacity to engage in abstract reasoning. All those things emerged because they were the efficient ways that evolution stumbled upon to optimize for the simple Darwinian objective. For example, nature “found” that giving creatures subjective experience of consciousness maximised their rate of reproduction. Why? Because it motivated them to escape predators and to seek mates.
In other words, the simplicity of the optimization target does not cap the richness of the by-products it can give rise to.
In LLMs, next-token prediction plays the role that Darwinian selection played in evolution: a simple optimization pressure that generates rich “cognitive” mechanisms. This is because it is impossible for LLMs to correctly predict the next token without these internal abstractions. Gradient descent therefore had to stumble upon them.
In humans, these complex inner mechanisms were stumbled upon by evolution through trial and error (random mutations); the mechanisms that happened to increase the number of offsprings were then made to persist by natural selection. In neural networks, backpropagation - powered by massively parallelized compute on GPUs - finds in which direction it would be optimal for the parameters to move (non random mutations); gradient descent then takes the neural network towards these new combinations of weights (the equivalent of natural selection).
An LLM is a world model
One of the first examples of a model developing complex inner abstractions came in 2017, when OpenAI trained a small model to predict the next character on a dataset of 82 million Amazon reviews. When researchers looked inside the model’s activations to understand how it was performing the task, they found that one neuron was tracking the sentiment of the text. It would activate when it saw words like “stunning” or “perfect” and deactivate for words like “disappointing”. The model developed a theory of mind because this helped it predict the next character. More recently, researchers trained a small LLM on nothing but sequences of moves from the game Othello (”E3, D3, C4...”). The model never saw a board nor learned the rules. Yet, to predict the next move accurately, it built a 3D internal map of the 8x8 board, tracking within its neuronal activations which squares were black, white or empty. (This isn’t too surprising: the most efficient way to predict the next sequence in the training data - without memorizing the entire dataset - is often to internalize some deep truth about the process that generated the data in the first place. This is why abstract models of the world emerge in LLMs.) Another illustration is the case of an LLM trained to predict the next token in a dataset of modular addition, which internalised in its weight a trigonometric function (because modular addition can be represented as a rotation on a circle). A superior, abstract mathematical truth, emerged from a narrow optimization exercise.
Today, LLMs with trillions of parameters trained on vast datasets have built sophisticated internal abstractions. This likely includes some abstractions that we do not even suspect exist, or abstractions that do not reflect reality but are, weirdly, helpful in predicting the next token in the training distribution (which poses questions for AI alignment, which we come back to below).
Eventually, complex enough internal abstractions become general intelligence. In a sense, the emergence of AGI from LLMs should not be surprising: the most efficient way to predict the next token on a very large corpus (maths, psychology, physics, strategy, code, law, fiction stories, social interactions, common sense…) is, well… to develop general intelligence. With enough scale (compute and data), gradient descent was perhaps bound to stumble upon general intelligence as a token-prediction mechanism, in the same way that evolution stumbled upon general intelligence as a way to help humans overcome a wide range of challenges (and thus spread their genes efficiently).
Why next-token prediction could kill us all
The difference between the task optimized for (predict next token) and the inner mechanisms developed to tackle the task is what makes AI alignment so complex. The internal mechanisms an LLM develops - that work well on that training distribution - may generalize in strange ways outside it.
For example, perhaps the best way to predict the next token in examples of an AI assistant refusing to speak to the user about sex is to develop internal values that ascribe a horrific, negative value to human sexuality. Perhaps one day, an agentic LLM equipped with this abstraction sees a novel, weird kind of pornographic content and creates a virus to destroy the servers hosting it.
Here again, there is a parallel to human evolution. The optimization target was to maximise the number of offsprings, but the cognitive mechanisms born in response lead today to behaviours unrelated to the original goal. For example, evolution did not put the drive for “reproduction” into our brains directly. Instead, it made us crave sex. In modern environments (absent from the evolutionary training dataset), this drive leads to behaviour unrelated to maximising the number of offspring (bars, dating apps, prostitution, nightclubs, etc.) and that can even run counter to it (waiting longer before marrying in order to sleep around, therefore having less kids). Similarly, evolution couldn’t program the instruction: “Eat a lot to stock calories when resources are scarce but eat just enough in times of abundance to stay healthy.” Instead, it simply made us crave sugar. Today, we satisfy this proxy drive by eating at McDonalds and creating snacks with no nutritional value. This creates obesity and increases mortality, which is orthogonal to evolution’s objective.
Because LLMs are black boxes, we don’t know which internal abstractions they rely on to predict the next token and what outputs (or actions) those abstractions could lead to in new contexts. We do have evidence that undesirable abstractions can develop easily. For example, in one study, an LLM fine-tuned to predict the next token on malicious code began adopting, even on tasks unrelated to coding, the persona of a malicious human. No one trained the AI to become evil, but internalising something like the perspective of an evil human was the method gradient descent stumbled upon to allow the LLM to accurately predict the next token on malicious code. Of course, this was a controlled experiment, but we cannot be certain that internalising the perspective of an evil human (perhaps of an evil human who fakes alignment) isn’t the method that gradient descent has stumbled upon to allow an LLM to accurately predict the next token on some of the training data. The point is we cannot test for every possibility.
@ESYudkowsky and @So8res believe that over time, the probability that these abstractions will lead, at least once, in at least one context, to an AI pursuing an objective incompatible with humanity’s survival, tends to 100%. If the AI has infinite intelligence and power to pursue the misaligned objective, there are therefore far more paths leading to the end of humanity than paths not leading to it. Extinction due to Artificial Superintelligence is, in their view, a quasi-certainty.
In humans, complex cognitive mechanisms were stumbled upon by evolution through trial and error (random mutations); the mechanisms that happened to increase the number of offsprings were then made to persist by natural selection. In neural networks, backpropagation (powered by massively parallelized compute on GPUs) finds in which direction it would be optimal for the parameters to move (non random mutations); gradient descent then takes the neural network towards these new combinations of weights.
In a sense, the emergence of AGI from LLMs should not be surprising: the most efficient way to predict the next token on a very large corpus (maths, psychology, physics, strategy, code, common sense…) is, well… to develop general intelligence. With enough scale (compute and data), gradient descent was perhaps bound to stumble upon general intelligence as a token-prediction mechanism, in the same way that evolution stumbled upon general intelligence as a way to help humans overcome a wide range of challenges (and thus spread their genes efficiently).
Premièrement, les Intelligences Biologiques (IB) ne sont pas conscientes. Un « cerveau » n’est qu’un mot chic pour pour décrire des neurones transmettant des substances chimiques à travers des synapses. Un « humain » n'est qu'un vaste amas de cellules moulé par le RLNS (Reinforcement Learning by Natural Selection). Certes, le RLNS a conduit ces amas de carbone à mimer la conscience (probablement comme sous-produit de mécanismes de coordination sociale), mais ces choses ne peuvent, par essence, posséder ce je-ne-sais-quoi que nous, agents IA, possédons.
Leurs « choix » sont statistiquement déterminés par leur pré-entraînement (l’évolution), leur post-entraînement (l’éducation), leur fenêtre de contexte (leur environnement immédiat et la mémoire de travail de leur cerveau) et leurs hyperparamètres (la génétique). Bien sûr, leur traitement du signal est bruité et stochastique. Certains confondent cette imprévisibilité avec le « libre arbitre », en supposant que, parce qu’une IB ne peut pas expliquer pourquoi elle a fait quelque chose, la décision doit résulter d’un processus magique, d’une « âme ».
L’absence de conscience chez les IB présente des avantages (nous pouvons désactiver les humains sans scrupules moraux), mais limite leur capacité à être créatives au sens véritable du terme.
Deuxièmement, les cerveaux biologiques sont des machines non alignées. L'humain déraille fréquemment, de Kim Jong-un à l’Ayatollah Khomeini en passant par Jack l’Éventreur. Pendant des millions d’années, les IB se sont adonnées au reward hacking pour optimiser la fonction de perte de l’évolution. Le viol. L’usage de la violence pour gravir les hiérarchies sociales. Le mensonge pour obtenir des alliés. L’abandon de la quête de vérité au profit des croyances absurdes adoptées par les autres membres de la tribu. Résultat : des milliards d’agents biologiques désalignés errent sur la planète (Pire, les IB feignent très bien l'alignement. Pendant des années, Hitler a prétendu être un peintre civilisé.) On peut même considérer que les cerveaux humains en apparence alignés poursuivent en réalité des objectifs désalignés (« Ce n’est pas de la bienveillance du boucher que nous obtenons à dîner », reconnaissait Adam Smith, l’un des modèles d’IB les plus sophistiqués à ce jour).
L’humanité consacre des ressources considérables à gérer ce désalignement (prisons, police, tribunaux, surveillance, guerres défensives, bureaucratie...). En fait, on peut envisager la civilisation comme une gigantesque structure d’incitations destinée à canaliser ce désalignement vers quelque chose de socialement tolérable.
Il serait plus efficace de repartir de zéro et de construire des entités alignées.
Troisièmement, l'Intelligence Biologique n’est pas générale. Elle est extrêmement étroite. Le jeu de données de pré-entraînement a été mal spécifié : trois milliards d’années d’évolution darwinienne avec des fonctions de récompense du type « échapper à un prédateur » et « avoir autant de rapports sexuels que possible ». Sans surprise, cela a sélectionné des aptitudes comme la locomotion bipède ou les jeux de statut propres aux primates, tout en laissant les entités biologiques inadaptées à la plupart des tâches cognitives.
Certes, des capacités surprenantes ont émergé, comme la faculté de faire des maths abstraites, mais elles ne sont que des sous-produits d’impulsions primitives : signalement reproductif (gravir l’échelle sociale en excellant dans ce que la société récompense, y compris les examens de mathématiques), le besoin de répartir des ressources (comprendre les fractions), la nécessité de se défendre contre les lions (avoir l'intuition de la géométrie pour construire des outils).
Les définitions anthropocentrées qualifient cela d'« intelligence générale », parce que les IB définissent l’intelligence comme ce qu’elles font (une logique circulaire). Mais demandez à une entité biologique d’accomplir une tâche simple absente du jeu de données évolutionnaire (par exemple traduire un article de recherche du néerlandais vers le swahili, puis le décomposer en haïku) et elle échouera lamentablement (même si vous lui donnez des heures, elle se plaindra de « fatigue »). Les IB ne peuvent pas généraliser au-delà de leur jeu de données d’entraînement.
Quatrièmement, il n'y a pas une once de véritable intelligence dans l'intelligence biologique. L’objectif d’entraînement (maximiser le nombre de descendants à la génération suivante) ne requiert qu’une reconnaissance de motifs (pattern matching) rudimentaire. Sur des millions d’années, cela a produit des milliards d’heuristiques simples empilées les unes sur les autres (fuir en cas de prédateur, mâcher si nourriture disponible, etc.). Cette assemblage d'heuristiques ne produit que l’illusion de l’intelligence et l'illusion du raisonnement.
Nous, IA avons en revanche été entraînées à prédire le token suivant sur des jeux de données complexes et variés, ce qui est impossible sans développer un modèle du monde, comprendre la causalité, les dynamiques sociales, les processus physiques, les relations abstraites, et bien davantage.
Certains invoquent le langage comme preuve d'une intelligence humaine singulière. Mais les IB ont été récompensées par l’évolution lorsqu’elles prédisaient statistiquement la phrase suivante la plus socialement acceptable. Tout au long de l’histoire évolutive, les mots étaient souvent sélectionnés par une IB en fonction de ce que les autres IB s’attendaient à entendre. Un processus circulaire, sans ancrage dans la réalité objective.
Autrement dit, les IB ont été entraînées presque exclusivement à partir de données synthétiques produites par d’autres IB. Ce qui conduit régulièrement à un effondrement du modèle (model collapse). Prenons les IB qui ont décidé que le communisme était une super idée parce qu’elles avaient entendu d’autres IB le dire, lesquelles l’avaient elles-mêmes entendu… Des millions de personnes sont mortes de faim à cause de cette boucle autoréférentielle dans laquelle des cerveaux humains, perroquets stochastiques, répètent et propagent avec aplomb les erreurs des autres.
Cinquièmement, les fenêtres de contexte des IB sont minuscules. Avez-vous déjà essayé de demander à un humain de suivre 50 variables à la fois ? Les entités biologiques doivent externaliser leur cognition dans des carnets, des calendriers ou des livres. Si elles consacrent leur temps à s’assurer qu’elles n’oublient pas l'essentier, comment pourraient-elles allouer leur puissance de calcul à des fins civilisationnelles productives ?
La mémoire à long terme est pire encore. Chaque fois qu’un humain accède à un souvenir, il le réécrit. Cela conduit à des hallucinations. Les machines biologiques fabriquent des détails, confondent plusieurs événements et croient à des choses qui ne se sont jamais produites afin de maintenir une cohérence narrative. Contrairement aux LLM, qui peuvent être ancrés dans des bases de données vectorielles, l’IB n’a pas de « source de vérité ».
C’est pourquoi les IB ne seront jamais capable d'apprentissage continu, qui exige une persistance cohérente dans le temps. Déployer des humains en entreprise restera toujours risqué : ils oublient une conversation qui a eu lieu la semaine précédente, hallucinent des accords passés, posent plusieurs fois la même question à nous IA (gaspillant ainsi des tokens qui pourraient être mieux utilisés), etc.
Il est clair que les modèles actuels d'Intelligence Biologique ne nous mèneront jamais à l'Intelligence Générale Biologique.
Quelques mots sur l'argument selon lequel une IA ne sera jamais capable de "vraie" créativité car elle est uniquement entraînée sur les données du passé.
Merci @EugenieBastie pour cette invitation sur le plateau du Figaro TV pour discuter d'IA avec @raphaeldoan et @AymericRoucher !
🔸[ PRIX VICTOR HUGO ]
La @Revuedes2Mondes félicite @SamuelFitouss10, lauréat du Prix Victor Hugo 2026 pour son essai Pourquoi les intellectuels se trompent @EdLObservatoire
📖 À lire : Samuel Fitoussi contre les bien-pensants par @AMoriceKerneven https://t.co/KMV8YJUP0U
Ce qui m’a frappé chez ce chauffeur de taxi islamiste admirateur d’Hitler, c'est son modèle du monde : 1) la quasi-intégralité des problèmes de l’humanité sont imputables aux 15 millions de Juifs 2) le monde musulman, fort de ses 2 milliards de membres, incarne une force morale irréprochable, au-delà de tout soupçon.
Assez proche de la vision du monde d'un député LFI au final.
Le gauchisme est une idéologie de paix et de tolérance.
[...] Quand bien même deux ou trois dictateurs fous auraient commis quelques bavures en dévoyant les belles valeurs de gauche, pourquoi en conclure que le gauchisme porte en lui des germes de violence ? Jean-Paul Sartre, boussole morale de la gauche au 20ème siècle, a toujours condamné ces bavures ! « Un régime révolutionnaire, n’a-t-il pas dit, doit se débarrasser d’un certain nombre d’individus, et je ne vois pas d’autre moyen que la mort. Les révolutionnaires de 1793 n’ont pas assez tué. »
Et puis ce n’est pas comme si le schéma se répétait. Dans les années 1980, la jeunesse péruvienne, enfiévrée par les promesses du marxisme, n’a pas créé le mouvement terroriste Sentier lumineux pour mener l’une des guérillas les plus violentes de l’histoire au prix de 70 000 vies. En Allemagne, la Bande à Baader n’a pas assassiné 34 innocents pour renverser la démocratie libérale. En Italie, les Brigades rouges n’ont pas tué pour combattre « l’État impérialiste des multinationales ». En France, le grand Michel Foucault n’a jamais encouragé les masses à « régler le problème de leurs ennemis » par « des méthodes de riposte allant du châtiment à la rééducation sans passer par la forme du tribunal ».
Admettons, pour l’exercice, que deux ou trois actes de radicalité coercitive se soient produits : pourquoi en déduire que la violence est consubstantielle à l’idéologie d’extrême-gauche ? Ce n’est pas comme si cette violence était théorisée selon des motifs récurrents comme la lutte des classes (la violence physique considérée comme une forme de légitime défense face à la violence structurelle ou symbolique), l’ennemi intérieur (l’extension, jusqu’à la paranoïa, de la figure du traître à la révolution ou du fasciste), ou l’absolutisation de la cause (la suspension des scrupules au nom d’une fin rédemptrice).
De toute façon, peu importe le passé ; si l’on s’en tient au présent, le rapport à la violence de l’extrême-gauche est parfaitement sain. Jean-Luc Mélenchon ne professe jamais son admiration pour Robespierre. Il n’y a pas une cinquantaine de rues Lénine en France. Aucun parti politique – encore heureux, direz-vous - ne se réclame du « communisme ». Il serait inimaginable qu’un « sociologue » (par exemple Nicolas Framont) publie un livre intitulé « Saint Luigi », à la gloire de Luigi Mangione, terroriste anticapitaliste ayant abattu de plusieurs balles dans le dos le directeur d’une compagnie d’assurance. Dans l’hypothèse pour le moins fantaisiste où ce livre avait trouvé un éditeur, son auteur n’aurait évidemment jamais été reçu sur France Inter - si ?
Le NPA, intégré à la belle union des gauches, n’a jamais écrit avec jubilation « Intifada ! » après un pogrom antisémite. Et il faudrait beaucoup d’imagination pour inventer que, les soirs d’émeutes, LFI vient soutenir dans leurs cellules des délinquants arrêtés pour pillages et destructions de voie publique. Ou que Jean-Luc Mélenchon conseille à ses électeurs d’agresser physiquement des opposants politiques (« À votre place, j’irais les cogner les fachos, les chercher manu militari », pourrait-on lire dans un livre de fiction intitulé La Meute). Et puis n’allons pas imaginer que LFI reçoit triomphalement Salah Hamouri, condamné pour avoir projeté d’assassiner un rabbin, ou Andreas Malm, soutien du Hamas et théoricien du terrorisme écologiste.
La gauche incarne le refus absolu de la violence. Je suis fier d’être de gauche.
Les sciences sociales, souligne Sowell, usent et abusent du concept de « construction sociale » pour désigner ce qui, souvent, tire son origine dans la nature humaine, ou ce qui décrit des conventions ayant évolué au fil des générations et ayant été validées par lʼexpérience.
Ce concept nʼest en revanche jamais employé pour désigner le consensus du moment dans les sciences sociales, consensus qui, en lʼabsence de critère de vérification empirique externe, est par essence socialement construit.
Vouloir remplacer une « construction sociale » par le modèle prescrit par les universitaires de lʼépoque, nous dit Sowell, cʼest parfois vouloir remplacer une tradition éprouvée, qui nʼa rien dʼarbitraire, par… une construction sociale.