Les 15 minutes à voir de l'audition d'Arthur Mensch de Mistral IA.
Je retiens : avec l'IA, les datacenters transforment de l'électricité en intelligence. La 🇫🇷 a un coup à jouer grâce à l'électricité abondante issue de son parc nucléaire : devenir exportatrice d'intelligence.
C'est très concret cette production d'intelligence : pilotage d'un drone par IA, génération de ligne de codes par IA etc.
Mistral réalise déjà 70% de son CA hors de France, c'est donc déjà un exportateur d'intelligence.
Si nous n'y arrivons pas, nous importerons l'intelligence des Etats-Unis et perdrons la valeur ajoutée. Le marché européen est gigantesque : 1 trilliard d'€, soit 10% de masse salariale européenne.
Il faut donc valoriser au maximum notre surplus de production électrique en construisant des datacenters en France : exporter de l'électricité, c'est comme exporter une matière première sans la transformer, et donc perdre 90% de la valeur ajoutée. C'est comme exporter du cobalt sans le transformer en batterie.
Holy shit... Microsoft open sourced an inference framework that runs a 100B parameter LLM on a single CPU.
It's called BitNet. And it does what was supposed to be impossible.
No GPU. No cloud. No $10K hardware setup. Just your laptop running a 100-billion parameter model at human reading speed.
Here's how it works:
Every other LLM stores weights in 32-bit or 16-bit floats.
BitNet uses 1.58 bits.
Weights are ternary just -1, 0, or +1. That's it. No floats. No expensive matrix math. Pure integer operations your CPU was already built for.
The result:
- 100B model runs on a single CPU at 5-7 tokens/second
- 2.37x to 6.17x faster than llama.cpp on x86
- 82% lower energy consumption on x86 CPUs
- 1.37x to 5.07x speedup on ARM (your MacBook)
- Memory drops by 16-32x vs full-precision models
The wildest part:
Accuracy barely moves.
BitNet b1.58 2B4T their flagship model was trained on 4 trillion tokens and benchmarks competitively against full-precision models of the same size. The quantization isn't destroying quality. It's just removing the bloat.
What this actually means:
- Run AI completely offline. Your data never leaves your machine
- Deploy LLMs on phones, IoT devices, edge hardware
- No more cloud API bills for inference
- AI in regions with no reliable internet
The model supports ARM and x86. Works on your MacBook, your Linux box, your Windows machine.
27.4K GitHub stars. 2.2K forks. Built by Microsoft Research.
100% Open Source. MIT License
We’ve identified industrial-scale distillation attacks on our models by DeepSeek, Moonshot AI, and MiniMax.
These labs created over 24,000 fraudulent accounts and generated over 16 million exchanges with Claude, extracting its capabilities to train and improve their own models.
🌧️C'est au large de la Bretagne que se situe depuis le 1er janvier la plus forte anomalie négative de pression observée sur la planète : écart à la normale de -19 hPa, une valeur remarquable pour une moyenne sur 45 jours. D'où le défilé ininterrompu de perturbations depuis le début de l'année sur la France.
Jeff Bezos affirme qu’il n’existe « aucun plan B » pour la Terre, et soutient que l’industrie lourde y compris les usines et les centres de données devrait être déplacée sur la Lune et dans des stations orbitales afin de protéger la planète.