La semana pasada me puse a jugar con el sdk de openrouter para hacer agentes.
Le pedí al becario que me explicara muy verbosamente cómo es que el llm sabía que tools llamar. Me explicó paso a paso cómo el sdk se encarga de eso
🤯🤯🤯
Uno de los usos mas frecuentes que tengo con el becario es mandarlo a hacer frontends/dashboards con diferentes fuentes de datos.
Bajo los datos en crudo, luego los “cruzo” y finalmente el minisitio para armar la historia y entender mejor como va el producto
Levantar la mano mientras internamente pienso “ahi veo como le hago” me ha llevado a estar casi cada semana construyendo cosas nuevas que nunca había hecho antes.
Ahora toca aprender sobre cached inputs 🤓
Construí un dashboard ya que las trazas de datadog no se prestan para desenmarañar y reconstruir la historia de algo de manera más visual...
Ahora puedo ver toda la conversación como si fuera chat y la traza de cada mensaje, cada tool, en un side bar. Así como cada sub agente
Querido diario, hoy, con ayuda del becario, reduje los tiempos de respuesta del agente en un 33% 😄
Más que una solución técnica, fue 100% product sense/taste, conocer a los usuarios y entender qué realmente necesitan
Más de la mitad de lo que traíamos era innecesario🤡
Según las pruebas:
Información bien bien ordenada + bm25 hace innecesario ponerle el query expander, ni el llm reranker....El detector de intención es un nice to have
No aplica para miles de documentos
Según las pruebas:
Información bien bien ordenada + bm25 hace innecesario ponerle el query expander, ni el llm reranker....El detector de intención es un nice to have
No aplica para miles de documentos
RFC doc + transcripts feeds linear agent which breaks it down to issues. Codex/Claude creates detailed technical work plan per issue, this file includes prompts so sub agents know what to do.
Another agent instance takes the orchestration plan and starts working
@silvercorp Codex hace feature, Claude y Gemini le dan feedback. Guardan en feedback en un md.
Codex lee ambos feedbacks y responde con pros y cons de cada sugerencia.
Le indico que tomar y que no.
Todo dentro de cursor agents
small obvious insight while working with codex:
Been doing the same thing every day, so 2 days ago i told codex, hey write an .md file so another agent can do what i've told you, also write the py code you've been using.
fast forward yesterday -> hey do X using instructions.md