Introducing DiffusionBlocks: Block-wise Neural Network Training via Diffusion Interpretation
https://t.co/c9AvsRKybj
What if we didn’t have to hold an entire neural network in memory to train it?
Standard neural net training optimizes all parameters jointly. As a result, the memory required during training grows linearly with the depth of the network.
In our #ICLR2026 paper, we propose DiffusionBlocks, a principled framework to train networks one block at a time, drastically reducing memory requirements while matching end-to-end performance.
With DiffusionBlocks, we split the network into blocks and train them one at a time, so you only need memory for a single block.
How? We explicitly assign each block a role: to move the representation a little closer to the target than the block before it did. That role turns out to be precisely what a diffusion model does, step by step. Each block only needs to optimize its own objective and can be trained independently.
We validated this across five different architectures:
• ViT
• DiT
• Masked diffusion
• Autoregressive transformers
• Recurrent-depth transformers
In each case, performance is competitive with end-to-end training while using a fraction of the memory.
This perspective also extends naturally to recurrent-depth (Looped) transformers, which apply the same network iteratively and normally require expensive backpropagation through time (BPTT). Viewed through DiffusionBlocks, we can replace those multiple iterations with a single forward pass during training.
Read our paper and code, to learn more.
Paper: https://t.co/CRj96VGYQn
GitHub: https://t.co/eNW0K9Xh8E
🐟
Anthropic ha publicado un taller sobre cómo construir una empresa solo con Agentes IA.
Agentes trabajando entre ellos, repartiéndose tareas y ejecutando procesos.
Gratis. Subtitulado al español.
Si quieres que la IA trabaje por ti, guarda esto 🔖
Si quieres aprender Python, SQL o Machine Learning, Kaggle tiene cursos gratuitos y con certificado.
Lo mejor es que van al grano desde cero. Te lo explican sin asumir que ya sabes. Perfectos para arrancar.
Duran solo unas pocas horas. Así puedes rápidamente aprender algo nuevo sin necesidad de invertir demasiado tiempo.
Puedes encontrarlos en la web de Kaggle, en la sección "Learn". No pongo el enlace porque ya sabes cómo se pone esta red social.
No me canso de recomendar el curso de la Universidad de Harvard para aprender a programar.
Es uno de los mejores cursos gratis de introducción a la ing. de software que existen (y ahora también con una asignatura sobre IA).
11 semanas junto al gran David J. Malan, con apuntes, vídeos, la posibilidad de enviar ejercicios y realizar un proyecto final.
Y sí, con certificado si superas el 70% de los ejercicios y el proyecto (revisa la sección web llamada "certificate").
→ https://t.co/JJNYzzu3i5
japon bir geliştirici, claude code'un kimsenin konuşmadığı trick'ini buldu.
"find skills" diye bir skill kurdu. claude code'un içine küçük bir mcp paketi gibi oturuyor. yapacağı işi bir kere yazıyor. claude, anthropic ekosistemindeki yüzlerce skill'i tarıyor, en uygun workflow'u kendi kuruyor.
> video script (notion + claude)
> b-roll seçimi (veo3)
> thumbnail (sora)
> caption + zamanlama (buffer)
> performans takibi (typefully)
hepsi tek prompt'la.
youtube kanalı durmadan içerik basıyor. o sadece outcome yazıyor.
millet hala "ai zaman kazandırıyor" sanıyor.
o ai'ya bütün workflow'unu yedirdi.
bizimkiler hala chatgpt'ye "şunu yaz" diyor.
KAYDET.
🚨 ULTIMA HORA : Google acaba de convertir Street View en un simulador del mundo real.
Genie 3 ahora puede recrear cualquier entorno físico a partir de las imágenes de Street View.
Google lleva filmando el planeta desde 2007.
Miles de millones de calles, edificios y barrios enteros almacenados en sus servidores.
Durante años, todo el mundo pensó que era solo para orientarse.
Era en realidad la mayor recopilación de datos del mundo real de la historia.
Y acaban de decidir hacer algo con ello.
🚨 ¡NOTICIA URGENTE: NotebookLM ahora puede enseñarte como un tutor privado de cualquier universidad prestigiosa!! Totalmente gratis
Aquí tienes 8 prompts (órdenes) que reemplazan horas de lecciones pagadas:
(Guarda esto antes de que se te escape)
Hilo: