Mike Ballesteros

@maballesterosv

CTO y co-founder de @GoKoan y @gokoan_ai. Imaginando cómo hacer que la tecnología ayude a la gente a aprender más en menos tiempo 📚 #edtech #ai #nlp

Joined March 2012

238 Following

100 Followers

452 Posts

Mike Ballesteros @maballesterosv

about 2 months ago

@thsottiaux I should be able to inspect the list of tools served by an MCP server

maballesterosv retweeted

Zain Shah

@zan2434

2 months ago

Imagine every pixel on your screen, streamed live directly from a model. No HTML, no layout engine, no code. Just exactly what you want to see. @eddiejiao_obj, @drewocarr and I built a prototype to see how this could actually work, and set out to make it real. We're calling it Flipbook. (1/5)

29K

25K

maballesterosv retweeted

rapha

@rapha_gl

4 months ago

yes agentic programming is miracle technology. but im more interested in what processes and tools we need to yield it with trust. early software did not have source control, unit tests or peer reviews. what is the agentic equivalent?

maballesterosv retweeted

Tibo

@thsottiaux

5 months ago

Codex now pretty much builds itself, with the help and supervision of a great team. The bottleneck has shifted to being how fast we can help and supervise the outcome.

216

180

414

601K

Who to follow

ML Engineering at Xyme AI

Play&go experience

@playgoxp

Las mejores experiencias para conectar el mundo físico y el digital #apps #Gamificación #RealidadAumentada #RealidadVirtual #playgoxp.

maballesterosv retweeted

Iñaki

@inakitajes

5 months ago

Mi hot take sobre el futuro de la industria del software Todo lo que diga aquí es mera interpretación desde mi punto de vista. No pretendo hacer futurología ni sentar cátedra, pero sí mojarme. Creo que es indudable que la llegada de la Inteligencia Artificial a la programación la ha cambiado por completo. Quizás todavía no de la forma radical que algunos promulgan, pero sí la ha cambiado. Eso ya es una realidad. Ahora bien, los cambios estructurales no se producen de la noche a la mañana. No nos vamos a levantar un día con la mitad de los puestos de trabajo desaparecidos. Pero ese día llegará. Las cosas pasan de forma gradual, a lo largo de meses o unos pocos años, como la inflación. No notas nada hasta que, de repente, te das cuenta de que los huevos cuestan el doble que hace un par de años. Creo que algo muy parecido va a pasar con la programación. La primera fase: el silencio En una primera fase empezarán a moverse las grandes estructuras. Lo primero no serán despidos masivos, sino **congelaciones de contratación**. Las empresas intentarán absorber las nuevas demandas de crecimiento con el mismo personal. Será una especie de layoffs silenciosos. Y lo interesante es que nadie se dará cuenta. Nadie dirá que perdió su trabajo. La industria seguirá creciendo, pero sin aumentar proporcionalmente el número de personas. El output crecerá, el headcount no. Cuando este modelo esté más controlado y, sobre todo, cuando empiecen a sentirse presionados por la aparición de equipos muy pequeños capaces de generar una competencia brutal contra los grandes actores establecidos, empezarán los layoffs progresivos. No de golpe. Poco a poco. Qué perfiles "sobreviven" Desde mi punto de vista, quedarán básicamente dos tipos de perfiles. Por un lado, los ultraespecializados. Gente muy senior, con muchísima experiencia, absolutamente fuera de serie en un área concreta. Ese nivel de expertise todavía va a tardar en ser sustituido, si es que llega a serlo del todo. Y por otro lado, los orquestadores. Personas multidisciplinares de altísimo nivel. Y aquí hago énfasis en lo de alto nivel: no vale ser “un poco de todo” con poca profundidad. Hablo de gente que entiende producto, tecnología, infraestructura, negocio y trade-offs reales. Roles que hoy ocupan muchos CEOs o CTOs fuertes. La gente de producto seguirá existiendo, pero cada vez más cercana a la tecnología real. Menos PowerPoint y más comprensión profunda de lo que se construye. Los grandes perdedores: el middle management Creo que los perfiles más afectados serán los middle managers. Su trabajo se basa en ser piezas dentro de estructuras de procesos jerárquicas. Aportan valor principalmente desde la gestión, no tanto desde la construcción directa del producto. No encajan en la ultraespecialización, pero tampoco en el perfil transversal fuerte. Quedan en tierra de nadie. ¿Aplica la paradoja de Jevons a la programación? Aquí es donde siempre tengo la duda. Podría plantearse un escenario optimista: si baja el coste de crear software, si hacer una aplicación pasa de costar 100.000 dólares a costar 3.000, la demanda podría dispararse. Muchísima más gente podría permitirse crear software. La industria, en lugar de contraerse, crecería. Este razonamiento encaja muy bien con la paradoja de Jevons: cuando un recurso se abarata, su consumo total aumenta. El problema es que, objetivamente, tengo la sensación de que en software no aplica del todo. Y no porque el software vaya a desaparecer. Todo lo contrario: el software va a estar más presente que nunca en todos los aspectos de nuestra vida. Todo será software. Y la otra mitad hardware. Y la otra mitad experiencias físicas. La pregunta no es si habrá software, sino si necesitamos tanto software nuevo. El elefante en la habitación: ¿queda innovación real? Esto es algo que ya venía de antes de la IA. Llevamos un par de décadas creando grandes categorías digitales: - Comunicación y redes sociales - Movilidad, logística y servicios bajo demanda - Economía digital personal - Productividad, trabajo y software utilitario - Salud, fitness y bienestar - ... La pregunta es: ¿independientemente de la IA, dónde acaba esto? ¿Por qué necesitamos otra app de notas más? ¿Cuándo necesitamos una nueva red social? ¿Necesitamos el nuevo Facebook? ¿El siguiente Notion? ¿Hay hueco para más innovación a esta velocidad? Tengo la sensación de que los grandes conceptos ya se han creado. Hay players muy fuertes en cada categoría y no veo un futuro de hiperfragmentación infinita en miles de nichos absurdamente específicos. No veo el escenario de "una app de notas para creadores", "una app de notas para futbolistas", ... Y aunque la IA abarate el coste y haga viable cualquier micro-nicho desde el punto de vista económico, aparece otro problema enorme: la distribución. El problema de la distribución no es nuevo. Lo único que hace la IA es agravarlo. Aquí entra de lleno la attention economy: el recurso escaso ya no es el código, ni el talento técnico, ni siquiera el capital. Es la atención humana. Si existen 10 millones de aplicaciones de notas, da igual lo buena que sea la tuya: competir por atención se vuelve casi imposible. La abundancia extrema no libera, satura. Por eso tiendo a pensar que la IA no va a generar una explosión de nuevos productos exitosos, sino acelerar la comoditización de la tecnología que ya estaba en marcha. Quedarán dos mundos: gigantes y artesanos Aquí encaja muy bien el marco clásico de Porter: comoditización vs diferenciación. Cuando el coste de producción se desploma, solo sobreviven dos extremos: 1. Los grandes: Grandes empresas tecnológicas con músculo, capacidad de amortiguación y, sobre todo, distribución. Plataformas que te dan correo, notas, pagos, almacenamiento, lo que sea. Aquí aplica claramente un modelo winner takes most: pocos ganan mucho, muchos compiten por migajas. 2. Los artesanos: Pocos, selectos, casi artesanos del software. Productos muy curados, muy especializados, o con una ventaja clara de autoridad, marca o distribución propia. El término medio, el grueso de productos y empresas "correctas pero no extraordinarias", desde mi punto de vista, desaparece. Esto nos lleva a pensar en que existe un cambio estructural de fondo Hasta ahora, el crecimiento de la industria tecnológica se basaba en una limitación clara: no había suficientes ingenieros. Muchísima demanda para muy poca oferta. Eso elevaba salarios, atraía inversión y generaba ese clima de abundancia, de "dinero fácil", de crecimiento casi automático. Con el abaratamiento masivo del trabajo intelectual técnico, la pregunta clave es: Si reducimos el coste de creación por diez, ¿se multiplica la demanda por diez? Y la verdad es que tengo mis dudas. Esto no va a pasar de golpe. Será lento, silencioso. Un día te despertarás y te darás cuenta de que todo ha cambiado. Siempre pasa así. Si seguimos tirando del hilo, esto nos lleva más allá del software: la comoditización del trabajo intelectual Y aquí ya no hablamos solo de programadores. Mi apuesta es que esto forma parte de algo mucho más grande: la comoditización del trabajo intelectual. Nos tranquiliza pensar que la IA "no es realmente inteligente", pero la mayoría de trabajos del planeta no requieren inteligencia en el sentido humano. Requieren conocer un conjunto de datos, saber consultarlos y devolver respuestas coherentes. La auténtica revolución es poder consultar bases de datos semánticamente y poder obtener respuestas ad-hoc y de forma instantánea. Ese es el gran avance. No la inteligencia, sino la búsqueda semántica real. Antes necesitábamos un experto intermedio que tradujera una pregunta humana a un lenguaje técnico, consultara la base de conocimiento y devolviera una respuesta. Ese intermediario ya no es imprescindible. Esto no es algo que vaya a pasar. Esto ya ha pasado. ¿Y ahora qué? No voy a aventurarme a predecir qué ocurrirá en 10, 15 o 20 años. No tengo ni idea. Pero ya que me estoy enfangando, hagámoslo hasta el fondo. Hay algo que sí tengo claro: esta conversación no va solo de software, ni de ingenieros, ni siquiera de tecnología. Va de qué hacemos cuando el trabajo deja de ser el eje central de la vida. Vamos a vivir, queramos o no, debates profundos sobre rentas básicas universales, sobre el valor social del trabajo, sobre el propósito, sobre identidad. Para mí, la pregunta no es si ocurrirá. La pregunta es: ¿en qué momento vamos a empezar a hablar de esto en serio? Si has llegado hasta aquí, me encantaría conocer tu opinión. Todo lo que he expuesto, no es más que un divague manifestado en voz alta de algo a lo que llevo dando la vuelta hace meses, y para lo que todavía no tengo respuesta con certeza.

943

153

696

146K

Mike Ballesteros @maballesterosv

5 months ago

@antor ¿Podrías ampliar para los que no tenemos ni idea -pero nos interesa-, cómo/dónde conseguir tu secuencia? La respuesta que le darías a un familiar, que a ChatGPT ya sé que puedo preguntarle. Tx de antemano.

Mike Ballesteros @maballesterosv

5 months ago

Muy grande, Andrés 🙌

Andrés Miguel Torrubia Sáez

@antor

5 months ago

I am open sourcing a tool that told me I may be partially resistant to HIV. I carry CCR5-delta32 , the same mutation that led to the first person ever cured of HIV: ~10% of Europeans have this. Most will never know. OWN your DNA sequence. Use GATTACA to analyze it.

antor's tweet photo. I am open sourcing a tool that told me I may be partially resistant to HIV.

I carry CCR5-delta32 , the same mutation that led to the first person ever cured of HIV: ~10% of Europeans have this. Most will never know.

OWN your DNA sequence.
Use GATTACA to analyze it. https://t.co/PYgiljmVta

maballesterosv retweeted

Shrey Kothari

@Shreyko

9 months ago

Introducing Among AIs, a social reasoning benchmark where embodied models play Among Us to test social intelligence: deception, persuasion, and coordination. We put 6 SOTA models in a live arena and GPT-5 came out on top by leading in Impostor & Crewmate wins. Why did GPT-5 get the highest scores? Why Among AIs? Let’s break it down 👇

Shreyko's tweet photo. Introducing Among AIs, a social reasoning benchmark where embodied models play Among Us to test social intelligence: deception, persuasion, and coordination.

We put 6 SOTA models in a live arena and GPT-5 came out on top by leading in Impostor & Crewmate wins. Why did GPT-5 get the highest scores? Why Among AIs?

Let’s break it down 👇

134

536

219K

Mike Ballesteros @maballesterosv

10 months ago

@pranaveight Does Codex Web use gpt-5? Tx!

142

maballesterosv retweeted

Google DeepMind @GoogleDeepMind

11 months ago

What if you could not only watch a generated video, but explore it too? 🌐 Genie 3 is our groundbreaking world model that creates interactive, playable environments from a single text prompt. From photorealistic landscapes to fantasy realms, the possibilities are endless. 🧵

812

13K

Mike Ballesteros @maballesterosv

11 months ago

@darkdreammer @360_Hardware Ahora el reto es saber paralelizar las tareas que le pides. Combinar desarrollo de features con limpieza de deuda técnica me está funcionando bien para que no interfieran entre sí. ¿Cómo lo abordas tú? Ah, y un buen https://t.co/9lQJPOKGKx, claro.

Mike Ballesteros @maballesterosv

12 months ago

Ya no se "programa" como antes. En mis inicios con Java recuerdo tener memorizado **todas** las funciones de los paquetes principales, porque no había autocompletado. El autocompletado paso a autocompletado inteligente de la IA. Y ahora el cambio es aún mayor.

maballesterosv's tweet photo. Ya no se "programa" como antes. En mis inicios con Java recuerdo tener memorizado **todas** las funciones de los paquetes principales, porque no había autocompletado. El autocompletado paso a autocompletado inteligente de la IA. Y ahora el cambio es aún mayor. https://t.co/IM3mekyE2w

maballesterosv retweeted

Andrej Karpathy

@karpathy

12 months ago

The race for LLM "cognitive core" - a few billion param model that maximally sacrifices encyclopedic knowledge for capability. It lives always-on and by default on every computer as the kernel of LLM personal computing. Its features are slowly crystalizing: - Natively multimodal text/vision/audio at both input and output. - Matryoshka-style architecture allowing a dial of capability up and down at test time. - Reasoning, also with a dial. (system 2) - Aggressively tool-using. - On-device finetuning LoRA slots for test-time training, personalization and customization. - Delegates and double checks just the right parts with the oracles in the cloud if internet is available. It doesn't know that William the Conqueror's reign ended in September 9 1087, but it vaguely recognizes the name and can look up the date. It can't recite the SHA-256 of empty string as e3b0c442..., but it can calculate it quickly should you really want it. What LLM personal computing lacks in broad world knowledge and top tier problem-solving capability it will make up in super low interaction latency (especially as multimodal matures), direct / private access to data and state, offline continuity, sovereignty ("not your weights not your brain"). i.e. many of the same reasons we like, use and buy personal computers instead of having thin clients access a cloud via remote desktop or so.

389

11K

Mike Ballesteros @maballesterosv

12 months ago

@mrm8488 A menudo es más eficaz introducir un estado dinámico en el system prompt que delegar este estado a tools en las que el agente debe decidir si llamar o no (ampliar su contexto). En ocasiones las llamadas a tools no se hacen justo porque no tiene el contexto adecuado.

maballesterosv retweeted

Evan Morikawa

@E0M

about 1 year ago

Now that o3 can so thoroughly answer any question I might have, I feel like the limiting factor is my ability to think of a question to ask.

621

49K

maballesterosv retweeted

Science girl

@sciencegirl

about 1 year ago

DNA replication process https://t.co/ub52g5NSSY

368

432

210K

Mike Ballesteros @maballesterosv

about 1 year ago

And they can pretty much 'talk' UI about anything... it's just a power no one's really explored yet.

Mike Ballesteros @maballesterosv

about 1 year ago

Most LLMs can already interact like this, @karpathy. We've seen it in our experiments.

Andrej Karpathy

@karpathy

about 1 year ago

"Chatting" with LLM feels like using an 80s computer terminal. The GUI hasn't been invented, yet but imo some properties of it can start to be predicted. 1 it will be visual (like GUIs of the past) because vision (pictures, charts, animations, not so much reading) is the 10-lane highway into brain. It's the highest input information bandwidth and ~1/3 of brain compute is dedicated to it. 2 it will be generative an input-conditional, i.e. the GUI is generated on-demand, specifically for your prompt, and everything is present and reconfigured with the immediate purpose in mind. 3 a little bit more of an open question - the degree of procedural. On one end of the axis you can imagine one big diffusion model dreaming up the entire output canvas. On the other, a page filled with (procedural) React components or so (think: images, charts, animations, diagrams, ...). I'd guess a mix, with the latter as the primary skeleton. But I'm placing my bets now that some fluid, magical, ephemeral, interactive 2D canvas (GUI) written from scratch and just for you is the limit as capability goes to \infty. And I think it has already slowly started (e.g. think: code blocks / highlighting, latex blocks, markdown e.g. bold, italic, lists, tables, even emoji, and maybe more ambitiously the Artifacts tab, with Mermaid charts or fuller apps), though it's all kind of very early and primitive. Shoutout to Iron Man in particular (and to some extent Start Trek / Minority Report) as popular science AI/UI portrayals barking up this tree.

$karpathy's tweet photo. "Chatting" with LLM feels like using an 80s computer terminal. The GUI hasn't been invented, yet but imo some properties of it can start to be predicted. 1 it will be visual (like GUIs of the past) because vision (pictures, charts, animations, not so much reading) is the 10-lane highway into brain. It's the highest input information bandwidth and ~1/3 of brain compute is dedicated to it. 2 it will be generative an input-conditional, i.e. the GUI is generated on-demand, specifically for your prompt, and everything is present and reconfigured with the immediate purpose in mind. 3 a little bit more of an open question - the degree of procedural. On one end of the axis you can imagine one big diffusion model dreaming up the entire output canvas. On the other, a page filled with (procedural) React components or so (think: images, charts, animations, diagrams, ...). I'd guess a mix, with the latter as the primary skeleton. But I'm placing my bets now that some fluid, magical, ephemeral, interactive 2D canvas (GUI) written from scratch and just for you is the limit as capability goes to \infty. And I think it has already slowly started (e.g. think: code blocks / highlighting, latex blocks, markdown e.g. bold, italic, lists, tables, even emoji, and maybe more ambitiously the Artifacts tab, with Mermaid charts or fuller apps), though it's all kind of very early and primitive. Shoutout to Iron Man in particular (and to some extent Start Trek / Minority Report) as popular science AI/UI portrayals barking up this tree.$

395

796

739K

Mike Ballesteros @maballesterosv

over 1 year ago

Con esto se empieza a desbloquear la magia... ✨🧙🏼‍♀️ La consistencia visual entre escenas es fabulosa. ¡Enhorabuena @OriolVinyalsML y equipo!

maballesterosv's tweet photo. Con esto se empieza a desbloquear la magia... ✨🧙🏼‍♀️ La consistencia visual entre escenas es fabulosa. ¡Enhorabuena @OriolVinyalsML y equipo! https://t.co/czJPoDAhEk

Oriol Vinyals

@OriolVinyalsML

over 1 year ago

Gemini 2.0 Flash debuts native image gen! Create contextually relevant images, edit conversationally, and generate long text in images. All totally optimized for chat iteration. Try it in AI Studio or Gemini API. Blog: https://t.co/pkeRzaD8b5

639

225

845K

Mike Ballesteros

@maballesterosv

Who to follow

Last Seen Users on Sotwe

Trends for you

Most Popular Users