CLL @CllTheCoder - Twitter Profile

4 days ago

The least efficient learning strategy is to ask “why am I so dumb” over and over. A more efficient strategy is to ask “what (prerequisite knowledge) am I missing” and go back and fill it in.

0

1

0

15

CllTheCoder retweeted

Aarno

@TheGlobalMinima

9 days ago

Do yourself a favour > go to https://t.co/auQJoYhm7b > find “most cited” list of papers > read the top 10 papers > one or two papers per week > read, read again, break it down, code it and write it back Some of the most influential and transformative work of the last decade can be found here. It will be an amazing experience!!

23

2K

157

2K

291K

CLL @CllTheCoder

13 days ago

when you create your own version of something, you learn better.

0

1

0

22

CllTheCoder retweeted

Scarlet @scarletrosedev

about 1 month ago

🔧 o que acharam desses vídeos especiais que estou criando para promover a https://t.co/GuxjiPdeVU?

3

7

2

1

402

CLL @CllTheCoder

3 months ago

@LayTXT Inclua ferramentas para automatizar fine-tuning dos modelos clássicos, se ainda estiver disposta a ajustar (e.g Optuna). Ajudam evitar ajustes manuais desnecessários

0

1

0

102

CLL @CllTheCoder

3 months ago

Referências Legais > https://t.co/bFBBqVoX0M > https://t.co/0Uoov8snuq

0

56

CLL @CllTheCoder

3 months ago

Chama-se work-memory e long-term memory. De fato, a work-memory é a informação presente no chat (mas não necessariamente o context windows). Você pode ter dez mensagens trocadas entre o user e o chat mas isso não estourar a janela de contexto e.g do Gema-4 31B é 256K.

CllTheCoder's tweet photo. Chama-se work-memory e long-term memory. De fato, a work-memory é a informação presente no chat (mas não necessariamente o context windows). Você pode ter dez mensagens trocadas entre o user e o chat mas isso não estourar a janela de contexto e.g do Gema-4 31B é 256K. https://t.co/YxawlqwsSn

Matheus Leandro Ferreira

@matheuslf

3 months ago

Existe um conceito nas LLMs chamado context window. Esses modelos funcionam com uma "janela de contexto", ou seja, eles só enxergam e utilizam as informações que estão dentro daquele trecho de conversa naquele momento. Porém, em alguns casos, dependendo da plataforma, também pode existir memória de sessão ou histórico, que influencia respostas futuras (Gemini tem isso). O que provavelmente aconteceu (chutando) ocorreu essa memória de chat. Numa outra oportunidade ele já teve ter pesquisado algo sobre tech, ou sobre você e o chat absorveu isso, respondendo dessa forma. Também pode fazer sentido uma mistura de contexto + inferência do modelo. Pode ser que, em algum momento anterior (até fora desse trecho visível), tenham surgido pistas, como nome, área, região, e o modelo acabou completando essas lacunas com informações plausíveis. Quando ele perguntou "quem é Julia?", ele entrou em um comportamento clássico de LLM. Ao invés de dizer "não sei", ele tentou gerar uma identidade coerente, combinando padrões comuns (nome brasileiro, universidade, área técnica, etc.). Isso dá a impressão de que ele "sabia quem você era", mas na prática é uma alucinação contextualizada, não um vazamento ou algo do tipo.

1

18

1

3K

1

6

1

0

544

CLL @CllTheCoder

3 months ago

No fim, pode não ter passado de um acidente, mas é curioso. Fica minha citação favorita: “Qualquer tecnologia suficientemente avançada é indistinguível da magia.”

1

0

58

CLL @CllTheCoder

3 months ago

@scarletrosedev A braba

0

1

0

58

CllTheCoder retweeted

Scarlet @scarletrosedev

3 months ago

Finalmente lançamos a versão web da @growlychatstore, com um agente integrado que aceita áudios - em breve com suporte a imagens e vídeos para pesquisa. Dá uma olhada! https://t.co/nNCpp0jem2

scarletrosedev's tweet photo. Finalmente lançamos a versão web da @growlychatstore, com um agente integrado que aceita áudios - em breve com suporte a imagens e vídeos para pesquisa. Dá uma olhada!
https://t.co/nNCpp0jem2 https://t.co/XzkA18wDrW

2

16

4

1

819

CLL @CllTheCoder

4 months ago

Where is: Is Hugging Face Or HuggingFace?

Julien Chaumond

@julien_c

4 months ago

lol

julien_c's tweet photo. lol https://t.co/eINsGeDWIW

13

170

4

5

25K

0

2

0

90

CLL @CllTheCoder

4 months ago

Essa pergunta tem tantas nuances que poderia refletir sobre o dia inteiro. Isto passa por formato (gguf), tools (vllm), quantização. É um tópico que existe bastante do Engenheiro.

Lorenzo

@lorenzolfm

4 months ago

Eu quero saber quem sao os brabo que rodam LLM local. Qual o estado da arte dessa porra?

65

385

8

194

59K

0

3

1

0

152

CLL @CllTheCoder

4 months ago

@lorenzolfm Recomendo, sempre que possível checar essa plataforma. https://t.co/Z5aW3KycK5. Também considere qual task tu precisa que o LLMs performa, isso pode mudar drasticamente o que tu considera SOTA.

0

2

0

7

1K

CllTheCoder retweeted

Kent Beck 🌻

@KentBeck

almost 14 years ago

for each desired change, make the change easy (warning: this may be hard), then make the easy change

21

2K

1K

224

0

CLL @CllTheCoder

4 months ago

2) AIE da Chipro, especificamente o capítulos 3 e 4, pois tratam sobre Eval.

0

1

0

43

CLL @CllTheCoder

4 months ago

No trabalho, estou colaborando com um módulo para avaliar os Agentes em produção, além de compreender as regras de negócios, dois recursos indispensáveis têm sido:

1

0

55

CLL @CllTheCoder

4 months ago

1) Foundation: Introduction to Agent Observability & Evaluations https://t.co/Xoey9oV0pJ

1

0

60

CLL

@CllTheCoder

Last Seen Users on Sotwe

Trends for you

Most Popular Users