AMD ACABA DE MATAR LAS SUSCRIPCIONES DE IA
La CEO de AMD Lisa Su presento oficialmente una PC del tamaño de una lonchera y ejecuto en vivo un modelo de 235 mil millones de parametros
Sin centro de datos. Sin nube. Sin GPU alquiladas
El chip en su interior es el AMD Ryzen AI Max+ 395
Es el primer chip x86 en el que la CPU y la GPU comparten el mismo bloque de memoria
Hasta 128 GB de memoria unificada
Una RTX 5090 te ofrece 32 GB de memoria de video
Una 4090 te da 24 GB
Pero esta pequeña maquina te ofrece mas de tres veces la memoria de cualquiera de ellas
Y cabe en una mochila
En inferencia con DeepSeek R1 le gano a una RTX 5080 por 3x
Una desktop del tamaño de un libro grueso superando una tarjeta grafica de mas de mil dolares en una carga de trabajo real de IA
Ahora haz las cuentas de tus suscripciones
Claude Code Max: $200 al mes
ChatGPT Pro: $200
Cursor: $20
Gemini: $20
Son $5,280 al año antes de construir una sola cosa
La version de 128GB de esta maquina cuesta entre $1,800 y $2,500
A ese ritmo se paga sola en menos de un año
Y despues corre sin costes adicionales, GRATIS
> Instalas Ollama
> Bajas Qwen3 235B
> Apuntas Claude Code a localhost
> La misma interfaz que ya usas
> Nada sale de tu maquina
> Nada cuesta por request
> Sin limitaciones a las 3am cuando por fin tienes tiempo para construir
Los abogados dejan de preocuparse por lo que OpenAI hace con sus archivos
Los developers dejan de ver el contador de tokens
Los founders dejan de matar prototipos porque la factura de la nube los asusta
La IA local ya no es solo una opcion mas economica
Es la unica IA que nadie puede quitarte
Y la pregunta ya no es si la IA local es lo suficientemente buena
Esta claro que si lo es
La verdadera pregunta es por que seguir pagando suscripciones cada mes cuando puedes correrla tu mismo
🆕 Today, we're releasing the public preview of Workflows, the orchestration layer for enterprise AI.
🌎 Enterprise teams have capable models. What they don't have is a way to run them reliably in production. That's the gap Workflows fills. It takes AI-powered business processes from prototype to production, with the durability, observability, and fault tolerance that production actually requires.
Leading organisations like ASML, ABANCA, CMA-CGM, France Travail, La Banque Postale, Moeve, and many others are already using Workflows to automate critical processes.
Google vient de sortir Gemini Embedding 2 et c'est un game changer pour le RAG.
Pour comprendre pourquoi, faut d'abord expliquer ce qu'est un embedding.
Un embedding c'est une façon de transformer n'importe quel contenu (texte, image, son, vidéo) en une liste de nombres. Un vecteur. Et la magie c'est que deux contenus qui veulent dire la même chose se retrouvent proches dans cet espace mathématique. "Chat" et "félin" finissent collés. "Chat" et "grille-pain" sont à l'opposé.
C'est ce qui permet à un moteur de recherche de comprendre ton intention au lieu de juste matcher des mots clés. C'est la brique de base de tout système RAG moderne, de toute recherche sémantique, de toute base vectorielle.
Jusqu'ici le problème c'était que chaque modalité avait son propre modèle. CLIP pour les images, Whisper + un embedder texte pour l'audio, un autre truc pour la vidéo. Des vecteurs incompatibles, des pipelines à 3 ou 4 modèles qu'il fallait stitcher à la main, et un cauchemar d'alignement.
Gemini Embedding 2 écrase tout ça. Un seul modèle, un seul espace vectoriel de 3072 dimensions, cinq modalités dedans : texte, image, vidéo jusqu'à 2 min, audio natif (sans passer par une transcription), et PDF.
Concrètement ça veut dire que tu peux :
Envoyer une requête texte "le moment où le client pleure" et retrouver la séquence exacte dans 4000 heures de réunions Zoom.
Chercher "chaussures de running bleues minimalistes" dans un catalogue e-commerce et que le modèle matche sur le texte ET l'image produit en même temps, sans avoir à aligner deux vector stores.
Indexer des podcasts sans les transcrire. L'audio va direct dans le même espace que tes docs texte.
Les chiffres sont brutaux. 68.32 sur MTEB English, 5 points d'avance sur le suivant. 68.8 sur la retrieval vidéo contre 60 pour Amazon Nova 2. Sparkonomy rapporte 70% de latence en moins après avoir remplacé leur pipeline à 3 modèles par celui-ci.
Cerise sur le gâteau, c'est entrainé en Matryoshka Representation Learning. Tu peux tronquer le vecteur de 3072 à 768 dimensions sans perdre en qualité. Stockage divisé par 4, recherche plus rapide, factures réduites.
Prix : 0.20$ par million de tokens, 0.10$ en batch. Pour 1 million de docs de 500 tokens, ça te coûte 50 balles.
La leçon stratégique : Google continue de faire ce qu'il fait de mieux. Pas de hype, pas de tweet sassy, juste une brique d'infrastructure qui rend obsolète trois produits concurrents d'un coup. Et qui s'intègre directement dans leur stack Vertex AI.
Le control layer se fait grignoter par le bas pendant qu'OpenAI fait des démos. Again.
GOOGLE JUST MADE IT DEAD SIMPLE TO CONNECT AI AGENTS TO ANY DATABASE
postgres, mysql, mongodb, bigquery, redis, elasticsearch, spanner, snowflake. 20+ databases supported
mcp toolbox is an open source...mcp server that gives your ai agents direct access to your enterprise databases in plain english
no custom connectors, no boilerplate, built-in connection pooling, auth, and opentelemetry out of the box
works with langchain, llamaindex, genkit, and any mcp-compatible client
less than 10 lines of code to plug it into your agent
https://t.co/6e4EY2gIfo
this is google making database access the easy part of building ai agents
🚨 Someone reverse-engineered the design systems of Apple, Spotify, Airbnb, and 30+ billion-dollar companies.
Packed each one into a single file. Free.
It's called Awesome Design MD.
Drop one file into your project. Your AI agent builds UI that looks like Spotify. Or Apple. Or Airbnb. Instantly.
Not screenshots. Not Figma links. A single DESIGN .md file that captures every color, font, spacing value, button style, and layout pattern from a real website. In a format AI agents read and reproduce.
Here's the difference:
Tell Claude Code "build me a landing page" and it gives you generic UI.
Tell Claude Code "build me a landing page" with Spotify's DESIGN .md in your project and it gives you Spotify.
Here's what's inside:
→ Apple. Premium white space, SF Pro typography, cinematic imagery.
→ Spotify. Vibrant green on dark, bold type, album-art-driven layout.
→ Airbnb. Warm coral accent, photography-driven, rounded UI.
→ Linear. Ultra-minimal, precise spacing, purple accent.
→ SpaceX. Stark black and white, full-bleed imagery, futuristic.
→ BMW. Dark premium surfaces, precise German engineering aesthetic.
→ NVIDIA. Green-black energy, technical power aesthetic.
→ Uber. Bold black and white, tight type, urban energy.
→ Sentry, PostHog, Raycast, Cursor, ElevenLabs, and 20+ more.
Here's how to use it:
→ Pick a design system from the collection
→ Copy the DESIGN .md file into your project root
→ Tell your AI agent to use it
→ Get UI that matches the design language of a billion-dollar company
That's it. One file. Your AI agent now has the design taste of a $200/hour design consultant.
Designers charge $5,000+ for a custom design system. Companies spend $50,000+ building one from scratch.
This is free. 31 design systems. Copy. Paste. Ship beautiful UI.
Works with Claude Code, Cursor, Codex, and any AI coding agent that reads project files.
100% Open Source. MIT License.
miam miam. Le code source de Claude a fuité.
Festin.
J'ai analysé le source leak de Claude Code. Ce qu'Anthropic construit en secret est bien plus fou que ce qu'ils annoncent.
Claude Code n'est pas un assistant de code.
C'est un OS pour agents.
Voici ce qui se cache derrière les feature flags.
Il y a une variable dans tout le codebase :
if (USER_TYPE === 'ant') return true
Les employés Anthropic ont accès à TOUT. Kairos, Advisor, multi-agents, sandbox. Vous utilisez la version démo. Eux utilisent le vrai produit.
-> KAIROS : l'agent qui agit sans qu'on lui demande.
> Il se réveille seul (SleepTool)
> Il vous notifie (PushNotificationTool)
> Il vous envoie des fichiers (SendUserFileTool)
> Il distingue ses messages "normaux" de ses alertes "proactives"
Claude qui tape sur votre épaule quand il a fini. Pendant que vous dormez.
-> ADVISOR : un Claude qui surveille Claude.
Un second modèle tourne en parallèle du modèle principal. Il observe. Il peut interrompre. Il injecte des corrections via des blocs API non documentés publiquement (advisor_result, advisor_redacted_result).
Un méta-Claude. En prod. Maintenant. Pour les ants.
-> PLAN MODE V2 — le nombre d'agents parallèles est tiérisé par abonnement.
Free/Pro : 1 agent
Max 20x / Enterprise / Team : 3 agents
Vous payez pas juste pour des tokens. Vous payez pour combien de Claudes travaillent en même temps pour vous.
-> Le mot ultraplan dans une conversation déclenche une session spéciale côté serveur.
Un keyword magique. Dans le code. Hardcodé. Qui change le comportement du modèle.
-> SANDBOX : @anthropic-ai/sandbox-runtime,
Un package npm interne. Restrictions filesystem, réseau par host pattern, callbacks sur violation.
Anthropic peut faire tourner Claude dans un environnement totalement isolé.
L'infrastructure pour des agents en prod dans des environnements hostiles existe déjà.
-> WILLOW MODE : Claude sait quand vous revenez après une longue absence.
Context > 100k tokens + 75 min d'inactivité = il détecte votre retour.
Trois variantes A/B : dialogue bloquant, hint discret, hint v2.
Il gère la reprise de conscience de la conversation.
-> BRANCH : /branch fork une conversation à n'importe quel point. Nouveau sessionId. Champ forkedFrom pour tracer la parenté.
Git. Mais pour des conversations avec une IA.
-> Et le easter egg : un système d'animaux de compagnie ASCII avec des raretés (common → legendary), des chapeaux, des stats nommées.
Les espèces sont obfusquées en hex dans le source pour ne pas apparaître dans les grep de canary strings des builds.
Ils ont caché un Tamagotchi dans Claude Code. Avec soin.
Ce que tout ça dit vraiment :
Anthropic ne construit pas un meilleur chatbot. Ils construisent un système d'exploitation pour agents avec scheduling, isolation, fork de contexte, supervision inter-agents et boucles proactives autonomes.
Le produit que vous voyez est le tutoriel.
@MistralAI faites un mix de ce bijoux avec Qwen et épatez-nous.
🚨 LE PLUS GROS BRAQUAGE DE DONNÉES DE L'HISTOIRE S'APPELLE POKÉMON GO.
Pendant 8 ans, 143 millions de personnes ont marché dans la rue pour attraper un Dracaufeu.
La réalité ? Ils travaillaient gratuitement.
Niantic vient d'avouer que les caméras des joueurs ont scanné les parcs, les vitrines et les trottoirs du monde entier sous tous les angles.
Le butin ? Une base de données visuelle de 30 MILLIARDS d'images réelles.
Ce n'était pas un jeu. C'était la construction secrète du plus grand dataset d'IA au monde.
Aujourd'hui, Niantic utilise vos balades du dimanche pour vendre des systèmes de navigation visuelle aux robots de livraison (sans GPS).
Aucune entreprise, même Google, n'aurait pu payer une flotte de véhicules pour faire ça.
Vous pensiez jouer à un jeu vidéo, vous étiez le sous-traitant bénévole de la robotique mondiale.
$GOOGL Gemini continues to gain share... rising to 24% from 21% three months ago and 6% a year ago.
In the AI economy, the winner will be whoever can deliver intelligence at scale across devices, apps & workflows & Google is clearly building that system across its ecosystem.
The VS Code extension for Claude Code is now generally available.
It’s now much closer to the CLI experience: @-mention files for context, use familiar slash commands (/model, /mcp, /context), and more.
Download it here: https://t.co/q95Cw4soMk
$LMND announced a 50% insurance rate cut for $TSLA drivers when FSD is active citing data that shows materially fewer accidents.
That’s one of the clearest third-party validations of FSD risk reduction so far.
Explore the 4 types of @Google ADK tools: Function, Built-in, Third-Party, and MCP. This guide helps you choose the best tool for your agentic application.
By @janakiramm https://t.co/zzJATCNKLP
Announcing Personal Intelligence, a more personalized @GeminiApp designed just for you.
How it works:
— Customized: With your permission, it reasons across your @Gmail, @YouTube, @GooglePhotos, and Search apps to share hyper-relevant and context-aware responses
— Secure: If enabled, you control which Google apps to connect to. This setting is off by default
— Useful: From travel plans based on your Google Photos to gym recommendations based on goals you’ve shared with Gemini, you get help tailored to your world
Personal Intelligence in beta is rolling out to Google AI Pro and AI Ultra subscribers in the U.S., with expansions to the free tier, more countries, and AI Mode in Search to come. Take a look at the Gemini app's personalized assistance in the clip below, then let us know what you would use it for!
Announcing our public preview of Chrome DevTools MCP! Experience the full power of DevTools in your AI coding agent → https://t.co/u5kOrjFgrq
With Chrome DevTools MCP, your AI agent can run performance traces, inspect the DOM, & perform real-time debugging of your web pages.
Your login flow is the front door to your store. 🖱️
With @Shopify’s new Customer Accounts + Auth0, merchants get MFA, SSO, passwordless, and branded logins, without breaking “Sign in with Shop.”
Full blog 👉 https://t.co/KSiWri05Mc
See it live at #Oktane25 at the Auth0 booth.
Meet INCA (INventory and CAtalog) – Uber Eats’ scalable catalog system for supermarkets, pharmacies & retail partners.
Built for: ✅ High SKUs ✅ Complex metadata ✅ Retail compliance
🔗 Get the deep dive: https://t.co/ywDbUpk0mM
#Scalability#Performance#Search#Uber#InfoQ
Claude Code now runs in GitLab CI/CD pipelines 🚀
Tag @ Claude in issues or merge requests to run automated coding tasks in secure containers, with all changes following your branch protection and review workflows.
✅ Available via the @AnthropicAI API, Amazon Bedrock, and Google Vertex AI
✅ Customize Claude Code for your codebase by adding a https://t.co/HJpYZ3Zgeg file to your repository root
✅ Delegate code reviews, bug fixes, and implementation plans to complete routine tasks asynchronously
Get started with Claude Code in GitLab: https://t.co/q4U5yJPQiN