cuando empezás a usar Hermes, vas a encontrar 3 archivos clave:
1) SOUL.md
→ define quién es el agente, su personalidad y cómo se comporta
2) USER.md
→ guarda información importante sobre vos, tus preferencias y cómo te gusta trabajar
3) MEMORY.md
→ guarda aprendizajes, decisiones y conocimiento que vale la pena conservar
al arrancar una nueva sesión, hermes carga estos archivos como parte del contexto inicial.
esa memoria se carga una sola vez al comienzo y permanece congelada durante toda la conversación.
si el agente actualiza USER.md o MEMORY.md, esos cambios se guardan inmediatamente, pero no modifican el contexto actual.
recién van a estar disponibles automáticamente en la próxima sesión.
además, USER.md y MEMORY.md tienen límites bastante chicos: 1.375 y 2.200 caracteres.
cuando se llenan, hermes tiene que decidir qué conservar, qué resumir y qué eliminar para hacer espacio a nueva información.
🌘 Kimi-K2.7-Code, our latest coding model, is now released and open-sourced!
🔷 Improved coding & agent performance over K2.6: +21.8% on Kimi Code Bench v2, +11.0% on Program Bench, and +31.5% on MLS Bench Lite.
🔷 Reasoning efficiency: Less overthinking, with 30% lower reasoning-token usage compared to K2.6.
🔷 Long-horizon coding: Improved instruction following, higher end-to-end coding task success rates.
⚡️ 6x High-Speed Mode coming soon!
🔌 Available today via Kimi API and Kimi Code.
🔗 Kimi Code: https://t.co/uvoSJKyGCY
🔗 API: https://t.co/EOZkbOwCN4
Le dieron el mismo código, el mismo prompt a MiniMax M3 y a Claude Opus 4.8, su tarea era encontrar 17 bugs reales plantados de antemano.
El resultado fue inesperado.
MiniMax M3 encontró 13 bugs por solo $0.07.
Claude Opus 4.8 encontró los mismos 13 bugs por $1.30.
El prompt fue el mismo:
“Audita el código en seguridad, confiabilidad, correctness y coverage. Escribe un reporte detallado. No modifiques el código.”
Claude en niveles altos (xhigh y max): máximo 15 bugs, pero con costos que llegaron hasta $3.39
Lo interesante es que aumentar el nivel de razonamiento no siempre mejoró los resultados de forma lineal.
En algunos bugs específicos (como transacciones asíncronas), los niveles medios los detectaron mientras que los niveles “max” los pasaron por alto.
Cuando se mira el costo por bug encontrado, MiniMax M3 gana por bastante margen.
Claude en modo máximo fue la opción menos eficiente en relación precio-rendimiento.
Para auditorías de código de alto volumen o revisiones frecuentes, modelos como MiniMax M3 ofrecen una relación costo-beneficio muy superior.
Para una revisión única ultra exhaustiva donde quieres exprimir hasta el último bug posible, Claude en configuraciones altas sigue siendo competitivo.
Los modelos más económicos ya están cerrando la brecha de forma seria en tareas de coding y análisis estático y haciéndolo más sostenible económicamente hablando.
A Swiss Army knife of free browser tools, with QR and barcode generators, a background remover, palette tools, a favicon maker, PDF preflight, typography calculators, social media croppers, and dozens more quick utilities. No login, no ads, and no tracking. Did we mention it’s FREE? 👀
As part of the round we're announcing @multigres v0.1 (alpha)
Multigres is like an "operating system" for Postgres, handling connection pooling, backups, and high availability. This is an open source release that you can self-host:
https://t.co/7q1PGfdb4z