Vale la pena guardar esta clase de Stanford.
1 hora y 44 minutos dedicados por completo a entender los modelos de lenguaje grandes desde cero.
No es el típico video corto de "Entiende ChatGPT en 10 minutos".
Es una clase real de CS229 que profundiza en la lógica subyacente.
Hoy en día, mucha gente usa la IA de forma intensiva, pero realmente no tiene ni idea de cómo funcionan estos modelos.
Cómo se generan los tokens.
Por qué el modelo predice la siguiente palabra.
Cuál es la diferencia entre entrenamiento e inferencia.
Por qué el contexto afecta el resultado.
Por qué la misma pregunta, planteada de forma diferente, puede arrojar resultados totalmente distintos.
No necesitas aprender todo esto hasta el punto de construir modelos tú mismo.
Pero si quieres usar la IA a largo plazo para escribir código, crear productos, generar contenido o hacer automatizaciones, al menos necesitas saber a grandes rasgos cómo funciona.
De lo contrario, es muy probable que termines viendo la IA como una herramienta mística.
Cuando funciona bien, piensas que es magia.
Cuando falla estrepitosamente, no tienes ni idea de dónde está el problema.
Este tipo de clase gratuita y pública vale mucho más la pena que pasar el tiempo viendo un montón de consejos fragmentados.