@naroh Totalmente. Igual que manda narices que hayas tenido que crear un portal para facilitar una información que debería facilitar la administración… El mundo en el que vivimos 😅
El verano pasado participé en un hackathon de Gemma 3n. En el writeup hablé de lo que había tenido que aplicar para controlar la salida del modelo en local. A ese conjunto de cosas lo llamé "taming" (domar). Ojalá hubiese utilizado la palabra "harness" 😅https://t.co/BZT4cjLkvv
Todo el código cerrado que puedas instalar en tus equipos, muy pronto dejará de serlo. Todo el software que ejecutes en tu infraestructura, pronto será open source. El fin de una era.
@jcfmunoz Es lo que anunciaron en un principio, ¿no? Y lo que llevan intentando hacer desde entonces, pero no habrán conseguido un LLM que funcione… Ahora que Gemma 4 es Apache 2, es el momento de hacer un fine-tuning con su documentación y aprovechar el regalo.
Con el objetivo de seguir aprendiendo sobre ello, he decidido delegar el mantenimiento de uno de mis side projects en manos de un agente.
Son pequeñas tareas que requerían revisión diaria y que ya no están a mi cargo.
La ruta hacia un software totalmente autónomo avanza como si de una apisonadora se tratara.
El ambiente es tan disruptivo que resulta difícil predecir no ya lo que pasará el año que viene, sino cómo se estará programando dentro de un mes. 👇
@david_bonilla@jerolba Por la última frase, es evidente que no se cree del todo que lo hayas escrito tú 😜. Se ha comportado como cuando alguien te dice: tengo “un amigo” al que le ha pasado… 😁
Como en el mismo artículo indico, tempus fugit. He tardado un año en escribir de nuevo en el blog. Y el resultado no ha merecido la espera:
https://t.co/HdJ0Ihu4Fw
@javipas@NlpAga De ahí mi duda acerca del plan de ruta, porque la intención era publicarlos, al menos los generados para el fine-tuning, a la vez que el modelo por el mes de marzo (https://t.co/8dDANUQpyj).
Por supuesto, agradezco la apertura que ya existe.
¡Un placer la charla al respecto!
@javipas@NlpAga Lo ideal sería publicar esos datasets directamente, aunque eso no sería estrictamente necesario para considerarlos open source, de ahí mi segunda pregunta. ¡Muchas gracias por contestar! (4/4)
@javipas@NlpAga Tampoco es suficiente, en lo que respecta al modelo instruct-tuning, decir que han creado datasets sintéticos como "self-identity" con modelos de origen chino sin indicar los prompts utilizados. (3/4)