The least efficient learning strategy is to ask “why am I so dumb” over and over. A more efficient strategy is to ask “what (prerequisite knowledge) am I missing” and go back and fill it in.
Do yourself a favour
> go to https://t.co/auQJoYhm7b
> find “most cited” list of papers
> read the top 10 papers
> one or two papers per week
> read, read again, break it down, code it and write it back
Some of the most influential and transformative work of the last decade can be found here. It will be an amazing experience!!
@LayTXT Inclua ferramentas para automatizar fine-tuning dos modelos clássicos, se ainda estiver disposta a ajustar (e.g Optuna). Ajudam evitar ajustes manuais desnecessários
Chama-se work-memory e long-term memory. De fato, a work-memory é a informação presente no chat (mas não necessariamente o context windows). Você pode ter dez mensagens trocadas entre o user e o chat mas isso não estourar a janela de contexto e.g do Gema-4 31B é 256K.
Existe um conceito nas LLMs chamado context window.
Esses modelos funcionam com uma "janela de contexto", ou seja, eles só enxergam e utilizam as informações que estão dentro daquele trecho de conversa naquele momento. Porém, em alguns casos, dependendo da plataforma, também pode existir memória de sessão ou histórico, que influencia respostas futuras (Gemini tem isso).
O que provavelmente aconteceu (chutando) ocorreu essa memória de chat. Numa outra oportunidade ele já teve ter pesquisado algo sobre tech, ou sobre você e o chat absorveu isso, respondendo dessa forma.
Também pode fazer sentido uma mistura de contexto + inferência do modelo. Pode ser que, em algum momento anterior (até fora desse trecho visível), tenham surgido pistas, como nome, área, região, e o modelo acabou completando essas lacunas com informações plausíveis.
Quando ele perguntou "quem é Julia?", ele entrou em um comportamento clássico de LLM. Ao invés de dizer "não sei", ele tentou gerar uma identidade coerente, combinando padrões comuns (nome brasileiro, universidade, área técnica, etc.).
Isso dá a impressão de que ele "sabia quem você era", mas na prática é uma alucinação contextualizada, não um vazamento ou algo do tipo.
No fim, pode não ter passado de um acidente, mas é curioso.
Fica minha citação favorita: “Qualquer tecnologia suficientemente avançada é indistinguível da magia.”
Finalmente lançamos a versão web da @growlychatstore, com um agente integrado que aceita áudios - em breve com suporte a imagens e vídeos para pesquisa. Dá uma olhada!
https://t.co/nNCpp0jem2
Essa pergunta tem tantas nuances que poderia refletir sobre o dia inteiro. Isto passa por formato (gguf), tools (vllm), quantização. É um tópico que existe bastante do Engenheiro.
@lorenzolfm Recomendo, sempre que possível checar essa plataforma. https://t.co/Z5aW3KycK5. Também considere qual task tu precisa que o LLMs performa, isso pode mudar drasticamente o que tu considera SOTA.
No trabalho, estou colaborando com um módulo para avaliar os Agentes em produção, além de compreender as regras de negócios, dois recursos indispensáveis têm sido: