Although we use it in RLHF it serves a different purpose :)
I hope in the future we wont rely on Autoregressive techniques to produce text (maybe something like text diffusion)
The most interesting thing about it is that LLMs use forward kl
The same as classification
((Even when generating new text it simply predicting a class))
Unlike image generation(DDPM, Vaes,…)
If you want to perform a classification task (Supervised task)
Just remove the last fully connected layer and replace it with new one and fine-tune it.
The first CNN layers contains rich information it will do most of the job
اقوى من ال supervised train from scratch
Self supervised learning
تخيل عندك صورة غطيت جزء منها وخليت المودل يتوقع الجزء اللي صار له mask طيب تخيل عندك صورتين لنفس الشي وتبغا المودل يقرب هذي الصورتين من بعض لمن يسوي لهم Embedding
طيب تخيل عندك نص وتبغا الكلمة اللي ممكن تجي بعدها
كل هذي المهام بدون Human-labelled
يتبع.
﴿ و آخرُ دَعْواهُمْ أَن الْحَمْدُ لِلَّهِ ربِّ الْعالمِينَ ﴾
الحمدالله ما انتهى درب و ما خُتمَ جهد ولا تم سعي إلا بفضله، و الحمدلله الذي يسّر لنا البدايات و بَلغنا النهايات، تم تخرجي من جامعة ام القرى بكلية الحاسبات
وحصولي على درجة البكالوريوس مع مرتبة الشرف في تخصص الـ AI