@0xCVYH E o resultado final? Não achei lá . Sobre harness, porque preferiu o openhands ao invés do próprio codex que tem uma excelente nota no terminal bench?
Minha RTX 5090 treinou um modelo de Embedding sozinha nas últimas 24h.
44 iterações autônomas e 41 melhoraram o modelo.
Criei o primeiro embedding PT-BR treinado com 474K dados de empresas brasileiras reais.
Tech Stack, Cnae, segmento, Tipo de negócio, etc...
🧵
O loop decidia sozinho o que manter.
Inspirado no auto-research do Andrej Karpathy
Cada rodada:
→ gera queries com Qwen 35B
→ treina 4min na RTX 5090
→ avalia MTEB PT-BR
@0xCVYH Show demais! O que recomenda pra RTX 3090, pra rodar em batch 16-32 workers... no caso seria webscrapping mesmo.
Atualmente to usando qwen3 8b AWQ em VLLM com uns 8k de contexto e FP8, ta dando uns 2k tok/s output