@shizukaenojada1 fui dos veces, el año pasado y este, la ultima vez estuve 3 meses.
me reventó la cabeza.
no hay dia que no quiera volver.
mi unico objetivo en la vida es volver cuantas veces pueda
Por qué @c0mputeAI y $ZERO pueden explotar estos meses?
Ayer lograron 30.55 tokens/segundo en un modelo de 744 mil millones de parámetros (GLM-5.2) usando solo 6 GPUs RTX 6000 repartidas por EE.UU. con internet normal.
Lo hicieron con Shard (su código open-source): pipeline parallelism + speculative decoding. La latencia de red casi desapareció.
Esto demuestra que se pueden correr modelos frontier descentralizados, baratos, privados y sin censura.
$ZERO funciona así:
•Usuarios pagan en USDC → revenue real
•Revenue → buyback & burn de $ZERO
•Stakeas $ZERO → ganas USDC + créditos gratis + prioridad en la red
Primer avance real de inferencia distribuida a gran escala. DeAI dejando de ser solo hype.
GitHub: https://t.co/0Udo4T2LAT
Wow, it has happened!
30.55 tok/s on GLM-5.2 4-bit (from @Zai_org) ran by six RTX Pro 6000's across the USA scattered over WAN!
I can't believe this. It was an insane build, you can read more about it on https://t.co/8zDAVPMbDc