@AZERDSQ0329 Quand on active le raisonnement sur GPT 5.5 ça donne ça. GPT OSS 120B ajouté, puisque c'est celui dont je parle.
La comparaison avec Opus/GPT 5.5 ne fait pas sens, mistral medium a seulement 128 milliard de paramètres.
@HiGaetan Tout à fait correct sur l'architecture. Mais, toute chose égale par ailleurs, un modèle dense devrait avoir une qualité de sortie supérieure à un MoE.
@Eric_Diologeant Il faut regarder la réalité en face. On a voulu faire l'IA frugale parce qu'on voulait pas construire les infrastructures (raisons financières et idéologiques). Maintenant on a pas les ressources pour tenir la cadence et l'écart se creuse chaque jour qui passe.
La vitesse est inversement proportionnelle à la consommation de ressources. Pour 1 kWh, vous avec presque 3 fois plus de tokens de qualité équivalente avec le modèle de openAI qui a un an qu'avec le modèle français d'il y a un mois. C'est un échec pour l'IA frugale.
Le fait que mistral ait sorti un modèle (mistral medium 3.5) à peine meilleur, 3 fois plus lent et plus cher que GPT-OSS-120B quasiment un an après devrait nous alerter.
Sur les critères que ceux de l'état français c'est un échec.
Mistral est loin derrière les leaders américains et chinois, voilà la triste réalité que nos politiciens professionnels refusent de voir.
Ce graphique compare les meilleurs modèles mondiaux sur un score global (raisonnement, coding, agents, maths…), Mistral est tout en bas, pas parce que les Français sont moins bons mais parce que les sommes colossales déversées par les USA ou la Chine dans cette révolution technologique font tout.
Macron et les incapables qui nous gouvernent vendent du « champion national », mais les chiffres sont sans appel : la guerre de l’IA est déjà perdue pour l’Europe.
Y a des technos ou peut être on aurait eu une chance de rattraper, mais l IA nécessite des montants d'investissement que l'union européenne n'est juste pas capable de lever. On n'a plus les moyens de jouer dans la cour des grands. C'est ça la décadence.
@Mach_Low Encore pas mal de choses à améliorer. Mais elle a réinventé le n-heptane ce matin en essayant de faire la plus grande chaîne de carbone saturée d'hydrogène.
Dimanche 08h30 : Papa! Papa ! Papa! Je veux faire la balle vanille ! (construire la molécule de vanilline dans le jeux inspiré de la chimie organique pour les bébés que j'ai vibe codé)
Le taux de succès (perte de poids de 5%) à moyen terme (1 an) de l'accompagnement diététique (le régime) + amélioration du mode de vie (sport) est d'environ 5%.
C'est un mensonge de dire que ça fonctionne. C'est pas pour rien qu'on a eu le délire "healthy at all sizes".
Pas d'accompagnement diet, pas de prévention avant IMC 35/40, un médicament qui fait maigrir sans chercher à améliorer le mode de vie, on fonce dans le mur !
Truc rigolo : si vous ajoutez "démontre le raisonnement étape par étape" il donne la bonne réponse 100% du temps.
Ça ne surprendra personne qui a une connaissance même.
Démo : deepseek-v4-flash (thinking off) prompt standard 2 rolls, 50% fail. Prompt "raisonne" 3 rolls 0% fail.
@wittgensteinien Les entreprises établies ont un avantage massif niveau business, détrôner Microsoft office ou atlassian c'est juste impossible car la majorité des clients ont ce use-case spécifique que MS/atlassian leur donne et que tu ne peux pas développer juste pour eux.
@wittgensteinien Même en restant sur le software, l'architecture optimale pour 10 users c'est pas la même que 10 millions de users simultanés sur 5 continents.
Également, à 100 clients ça fait pas sens de développer + maintenir une feature pour 1% des utilisateurs, à 100k client, oui.