My first generation model.
Trained with just 53 tokens.
GPT-2 was trained with ~2 billion tokens, so yeah… small scale, but a big step for me.
🔎 Hugging Face test:
https://t.co/hXZaIjTfI1
💻 Repository:
https://t.co/8kXOfdk1S8
#machinelearning#AI#DeepLearn#Python
While studying transformers, I found the 'embedding' part to be fun and fascinating. Multi-head attention is crazy and a bit overwhelming, but I'm learning and growing in llms. I can’t sleep because I keep thinking about the stack of transformers (It's a meme)🥶
Just wrote a short paper on a key ML topic, how gradients adjust weights & biases to improve model performance. In large LLMs, it's almost automatic!
Read it here: https://t.co/we2eUWQ4D3
#MachineLearning#AI#DeepLearning#Gradients#ML
Pequeno redesign no meu LLMForge
Organizando melhor meus estudos e pesquisas sobre:
• LLMs
• Perceptron
• Neurônios artificiais
Agora o projeto está bem mais alinhado com minha identidade.
link: https://t.co/XvsPpncUc8
#AI#MachineLearning#LLM#IndieDev#BuildInPublic
Escrevi um artigo explicando um dos elementos mais fundamentais das LLMs: o neurônio artificial. No artigo mostro de forma simples como esse componente funciona dentro de uma rede neural.
Para quem quiser ler:
https://t.co/6Ttectnh7n
#MachineLearning#AI#NeuralNetworks
As primeiras palavras… 🥹
Recentemente entrei em um núcleo de machine learning, onde os dados passam por diversos processos e, ao final, o modelo treinado é capaz de prever as próximas palavras.
#InteligenciaArtificial#MachineLearning#Programacao#ChatGPT
Rede neural 1→16→8→1 aprendendo a aproximar a função seno 📈
Treino estável, loss despencando e previsão de sin(1.0) colada no valor real.
#InteligenciaArtificial#Tecnología
Para facilitar a visualização de como um neurônio funciona, desenvolvi um site simples hospedado na Vercel, onde �� possível visualizar e treinar o neurônio e, ao final, testar suas saídas, alcançando uma taxa de acerto de 90%.
https://t.co/LFOSp7dUOM
Large AI models may look like magic… but everything starts very small.
I built an artificial neuron from scratch to classify a specific input.
After training, it achieved ~90% accuracy and activates only when it receives the learned pattern.
#InteligenciaArtificial#ChatGPT
Comecei recentemente e estou gostando muito. Atualmente, estou mergulhado nos estudos de HTML, aprendendo os fundamentos dessa linguagem incrível. 🌐✍️ Animado para criar projetos empolgantes e me aprimorar nesse universo fascinante da programação.