Après son podcast de la semaine dernière (à ne pas rater) sur la chaîne... 🎧
👉 Voici aujourd'hui l'atelier de @davidschk sur l'utilisation, les cas concrets et toutes les questions que vous vous posez sur l'agent Hermes ! 🤖💡
https://t.co/aRgVkXbNis
Un grand merci encore @davidschk ! 🙏✨
🛡️ Les IA résistent mieux aux attaques.
Mais il suffit parfois de leur parler comme un commercial un peu insistant pour les faire céder davantage.
La sécurité applicative, mais avec des techniques de vente B2B. 😅
🚨Our paper is out in PNAS: we found classic human persuasion techniques worked on AIs in a "parahuman" way, making them agree to objectionable requests (upping compliance from 35% to 51%)
It worked on a range of major LLMs though newer models resist more https://t.co/BgsFPgpB1E
🔎 Exa lève 250M$ pour organiser le web pour les agents.
Les agents n’ont pas seulement besoin de modèles plus forts. Ils ont besoin d’un accès propre, fiable et frais à l’information.
La recherche reste une infra stratégique.
🧠 OpenAI annonce qu'un modèle a démonté une conjecture d'Erdős vieille de 80 ans.
Pendant ce temps, on débat encore pour savoir si l'IA est juste de l'autocompletion…
L'autocompletion commence à avoir des hobbies assez poussés quand même. 🤯
Today, we share a breakthrough on the planar unit distance problem, a famous open question first posed by Paul Erdős in 1946.
For nearly 80 years, mathematicians believed the best possible solutions looked roughly like square grids.
An OpenAI model has now disproved that belief, discovering an entirely new family of constructions that performs better.
This marks the first time AI has autonomously solved a prominent open problem central to a field of mathematics.
🔐 Comment empêcher Claude Code ou Codex d'ajouter un package npm ou PyPI douteux ?
Les agents de code ne changent pas seulement la vitesse de dev. Ils changent aussi la surface d'attaque.
🤦 La meilleure pub pour Codex aujourd’hui vient peut-être de Google…
Un des ingénieurs en charge d'Antigravity chez Google qui montre dans sa vidéo de présentation qu'ils utilisent Codex !
Au timecode 1:23 on peut voir un dossier "Codex" 👀
Introducing Antigravity 2.0, a new standalone desktop application that delivers fully on that original glimpse of a truly agent-optimized experience.
Rebuilt from the ground up with multi-agent teams, scheduled tasks, native voice and one-click integration with other Google products.
Learn how to get started with Antigravity 2.0 👇
@SylvainDeaure Pas mal la solution min-release-age !
En soi, si cela bloque au niveau de l'agent, il suffit d'une vérification et prise en main humaine, et donc d'éviter de se retrouver avec un fichier non voulu.
There's a new Release Notes podcast dropping soon, it'll be a really nice deep dive into Omni with the folks that helped make it.
But also, I had far too much fun using Omni to make this preview.
I broke my own rule to never post about AI detection as it is fraught in many ways.
The problem is that if you use AI a lot, you know AI writing on sight, which makes the difficulty of objectively proving that AI use to others very frustrating
We asked our agents to build a working operating system from scratch using @Antigravity 2.0 and Gemini 3.5 Flash.
It took:
⏱️ 12 hours
🤖 93 parallel sub-agents
🔄 15k+ model requests
🧠 2.6B tokens processed
💸 Less than $1K in API credits
To build a functioning OS from scratch.
#GoogleIO
⚡ Google annonce Gemini 3.5 Flash 12x plus rapide dans Antigravity.
On va pouvoir lancer des agents qui se trompent, se corrigent, relancent les tests et consomment des tokens beaucoup plus vite. 😅
Introducing Gemini 3.5 Flash ⚡️
Normally, Gemini 3.5 Flash is 4x faster than other models with frontier performance. For a limited time, Antigravity is serving it 12x faster thanks to custom inference tricks, delivering incredible speed for your workflows. 🚀
See the performance in this demo: generating pixel art from photos, orchestrating multi-agent workflows to write and register sprites, and spawning browser subagents to auto-test rendering: 👇
🛠️ Beaucoup d’équipes vont brancher Claude Code sur un monorepo de 10 ans puis conclure que l’IA code mal.
Claude s'en sort avec : CLAUDE.md propres, hooks, skills, LSP, MCP, subagents.
Bref, de l’engineering.
Pas un prompt magique !
Un post très intéressant :
What are best practices for running Claude Code at scale?
New blog post on what we've learned from teams running it across multi-million-line monorepos, decades-old legacy systems, and distributed microservices:
https://t.co/rJUYlIUiTT
0 à 14 000 abonnés YouTube en 1 an.
Sans audience, sans expérience et avec peu de temps.
Notre CEO @g_beyrouti vient de publier son étude de cas complète.
Il partage ses chiffres, ses conseils et son process de production avec IA👇
https://t.co/GFo7JuY2Jj
#youtube#casestudy
SCOOP: Anthropic has signed a term sheet with Greenoaks, Sequoia, Altimeter and Dragoneer for a $30bn round at $900bn pre-money.
Each expected to put in ~$2bn-plus.
I'm old enough to remember the last time Anthropic raised $30bn...
https://t.co/SxlDsinbqD
🖱️ Le détail intéressant dans Grok Build : une CLI interactive où tu peux vraiment cliquer.
Quand tu pilotes plusieurs agents en parallèle, l’UX devient presque aussi importante que le modèle.
Grok Build is a fully interactive CLI, which means you can actually use your mouse to click. No flickers.
Especially useful as I find myself running 5+ agents at a time and jumping between plans.
😏 On a donc levé 1M$ pour faire un marque-page IA.
Je me moque, mais c’est exactement comme ça que les nouveaux usages commencent : un objet un peu absurde, puis un jour tout le monde trouve ça normal.
Ou alors c’est juste un marque-page à 159$.
🪟 Windows n’avait pas vraiment prevu un mode "sandbox pour agent IA autonome"
OpenAI a donc fini avec deux users locaux, des règles firewall, du DPAPI, un runner dédié et des ACL en arrière-plan.
To bring Codex to Windows, we had to answer a hard question: how do you let coding agents stay useful without forcing developers to choose between constant approval prompts and full machine access?
Here’s how we built the Windows sandbox for Codex:
https://t.co/U8JfOe3WIG