Jo0ji - Yoake no Uta | Sub. Español • RomajiJo0ji - Yoake no Uta | Sub. Español • RomajiJo0ji - Yoake no Uta | Sub. Español • RomajiJo0ji - Yoake no Uta
@DotCSV Si se acerca al límite, que anda por los milímetros de presión, ahí ya sería más seguro y no invasivo que la tomografía computarizada, que es cara y daña tejidos por el uso extendido. Dudo que la iguale en precisión, pero como prueba rápida podrá ayudar bastante al diagnóstico.
NVidia needs to start training models that are specifically super powerful at writing and optimizing CUDA kernels, physics engines, training infrastructure and then open sourcing that
The next software platform moat is training AIs to use your software with superhuman ability
I'm fairly convinced there's some universal language manifold (= a surface formed by meaning vectors) that both humans and LLMs operate on. But we don't train LLMs to explicitly represent this manifold. We rather train them to approximate it, and to move along it by building curves on it.
And those curves are reasoning in geometric terms, like a reasoning trace is a curve on a low-dimensional manifold embedded in a very high-dimensional space.
The Linear Representation Hypothesis (https://t.co/2p3HZEGhX0) touches this, but I wonder if there's more recent work that takes the manifold idea further?
Would love to see takes from people with serious differential geometry backgrounds on this!
I found out the other day that any compression tool can be contorted to do language modeling. Turns out gzip can generate text that somewhat *resembles* Shakespeare. Short write up linked below
Beating baselines is fun. But I hear @JulianSaks has this running close to a minute. I'm going to keep on pushing until it's borderline instant.
All of this is going to be open sourced. Let's accelerate robotics. There's no reason we need to wait 6 hours for training runs.
@Argentinizando2@DenaonIsBack Es increíblemente fácil robar y engañar en una sociedad de alta confianza, literalmente apuñalas por la espalda a alguien que ni te consideraba enemigo, en vez de hablar de inteligencia, yo pondría a escrutinio cuál sería el origen de esas ideas.
@neogoose_btw Claude fue ajustado para andar en Claude Code, dudo bastante que realmente rinda igual. Lidiar con lo que no conoce le hace perder rendimiento.
56,000+ tokens/sec at just 80 MHz. 🤯
I burned a full Transformer with KV cache into a custom chip. Designed gate by gate as a 100% digital integrated circuit. Prototyped on a FPGA. (No GPU. No CPU)
Just pure digital silicon running @karpathy microGPT, spelling out names on a tiny LCD.
This is GateGPT 👇
@Argentinizando2 No le puedes ganar a esa cosa; lo máximo que puedes aspirar es al empate, y para eso se debe crear una subrealidad donde sus reglas no apliquen. Y esto ya existe, se llama ser civilizado. Así que si de verdad quieres ganarle a eso, comienza por no iniciar guerras ni genocidios.
DiffusionGemma can now run at 2000+ tokens/sec! ⚡
We made local DiffusionGemma inference 1.8× faster.
Run it on 18GB RAM via Unsloth Studio.
GitHub: https://t.co/aZWYAtakBP
Guide: https://t.co/wYLfJWE6kG
@roaneatan2 Ironically, it's a remarkably accurate representation of evolution: all the beauty it creates is the exact shadow of the millions it left behind. But just like in that animation, it deceives us—because we only ever see the pretty part.
@antonello Creo que sí lo hizo una persona, algo que suele delatar a la IA es que aún no consigue evocar vía el subtexto intenciones consistentes; en ese aspecto es superplana. Ese texto sí tiene subtexto, hay una presentación, un problema y un final. Parece evocar un formato de cuento.