أغلب الأوراق البحثية في الذكاء الاصطناعي اليوم تُظهر النتيجة النهائية فقط: نموذج قوي، أرقام مرتفعة، وتجارب ناجحة
لكنها لا تُظهر تفاصيل وتحديات الرحلة نفسها خلال التطوير مثل الأخطاء، الساعات الطويلة في إصلاح مشاكل مثل الـdataloader، أو الارتفاعات المفاجئة في الـloss التي تؤثر سلبا على التدريب، أو الأعطال الدقيقة في التوازي (tensor parallelism) أو بين ال GPUs التي قد تفسد التجربة بالكامل بعد أيّام من التدريب
ولسد هذه الفجوة، نشرت Hugging Face مدونة مميزة جدا واراها من أصدق واشمل المدونات اللي مرت علي بعنوان:
The Smol Training Playbook: The Secrets to Building World-Class LLMs
تأخذ القارئ والمتعلم خلف كواليس تطوير النماذج اللغوية لتوضح التجربة الكاملة لتدريب نموذج مثل SmolLM3 (3B) على أكثر من 11 تريليون وحدة (Token)، وتشرح بالتفصيل القرارات، التحديات، والإخفاقات والاخطاء التي لا تُذكر عادة في الأوراق الأكاديمية
المحتوى مليان بالتفاصيل العملية، من تصميم المعمارية لتحسين الكفاءة والاستقرار، إلى توزيع البيانات (Data Mixtures) لاختبار تأثير مصادر البيانات على جودة النموذج وتوازنه، وقوانين التوسّع (Scaling Laws) لفهم العلاقة بين حجم النموذج وكمية البيانات، وصولاً إلى كيفية اتخاذ القرارات أثناء التجربة بناءً على الملاحظات والنتائج الواقعية
✅ واحدة من أصدق وأشمل المراجع لأي شخص يريد أن يفهم او يتعلم فعلاً كيف تُبنى نماذج الذكاء الاصطناعي من البداية للنهاية.
أنصح بقراءتها بشدة
https://t.co/Cc5P6JEkwU
holy sh*t... your llm remembers everything you typed 🤯
researchers just proved you can recover the EXACT input text from a language model's hidden states.
not similar text. not approximate.
the actual words you typed.
here's what they found:
• transformer language models are mathematically injective
• different inputs = different hidden states (with probability 1)
• this isn't a coincidence or training artifact, it's structural
• they built SIPIT, an algorithm that inverts the model in linear time
• tested on billions of prompts across GPT-2, Gemma, Llama
• 100% exact recovery rate. zero collisions found.
the math is airtight.
transformers are real-analytic functions, which means collisions can only happen on measure-zero parameter sets.
at random init?
probability zero.
after gradient descent?
still zero.
you cannot accidentally make these models lossy.
the information doesn't compress. it doesn't abstract.
it just transforms into a different representation that perfectly preserves every token.
your prompt never leaves the model. it just lives in 768 dimensions instead of text.
this changes everything about how we think about llm internals, interpretability, and what "representations" actually mean.
نحن في فترة تتسارع فيها التطورات العلمية والذكاء الاصطناعي، وتتزايد فيها كمية المعلومات بما يفوق قدرة أي إنسان على الاستيعاب، لم يعد الذكاء أن تعرف او تستوعب كل شيء، بل اصبح أن تتعلّم بسرعة، وتتأقلم باستمرار، وتعيد تشكيل نفسك كلما تغيّر العالم مع التطورات السريعة
وطننا اليوم مليء بالفرص، أكثر من أي وقت سابق، لكنها لا تنتظر أحد. من يتأقلم أسرع هو من يحصدها، ومن يتأخر عن التعلم والتغيير، يتراجع مهما كانت خبرته أو ذكاؤه
الذكاء لم يعد يقاس بدرجة ذكائك المنطقي أو العاطفي، بل بقدرتك على التكيف، بما يُعرف بـ Adaptability Quotient او (AQ)، وهي مهارة البقاء والتطور والتاقلم في عالم لا يتوقف عن التحوّل. فالعقل بطبيعته يقاوم التغيير، لأنه يرى في الجديد تهديد وليس فرصة. لكن مع كل تجربة جديدة، وكل محاولة، وكل خطوة صغيرة نحو المجهول، يُعاد تشكيل طريقة تفكيره ليصبح أكثر مرونةً وثقة بالمستقبل
حينما نفكر عن الشركات التي نجت وسط الثورات التقنية، أو الأشخاص الذين أعادوا ابتكار أنفسهم في عالمٍ يتبدل بسرعة. ما ميّزهم لم يكن ذكاءهم، بل قدرتهم على التعلم الدائم والتاقلم بسرعة، والمرونة أمام المتغيرات، والشجاعة في مواجهة الفشل. ومن الامثلة الرهيبه Google Moonshot Factory (وهو مختبر شهير للابتكار والاختراع) ، يحتفلون بالفشل لأنهم يعلمون أن كل محاولة غير ناجحة هي خطوة نحو اكتشاف جديد وسُمّيت Google Moonshot Factory بهذا الاسم لأنها ترمز إلى السعي نحو للأهداف المستحيلة التي تتطلب تجربة، وتكيّف مستمر مع المجهول
من افضل ما قرأت، وهي مقالة قصيرة مدتها ٥ دقائق عن كيف تقرأ ورقة بحثية او مقالة ذكاء اصطناعي بذكاء وسرعة وهي من اهم المهارات في الزمان الحالي
خصوصا عدد الأبحاث والمقالات في الذكاء الاصطناعي أصبح ضخما جدا، ولا يمكننا قراءتها كلها ببطء واستيعابها، ومعظمها متشابه أو ضعيفة المحتوى
وفي هذه المقالة الكاتب يوضح أن الحل ليس في قراءة كل ورقة، بل في اكتساب مهارة التصفية السريعة:
اقرأ كثيرًا وبسرعة لتكوّن وتتعلم طريقة تمييز الأوراق الجيدة من العادية
طريقة القراءة الذكية تمر بثلاث مراحل:
- الفكرة العامة: ما الهدف من الورقة ولماذا أُجريت؟
- النتائج والأدلة: هل ما يعرضونه فعلا مقنع؟
- التفاصيل: تعمّق فقط إن كانت الورقة تستحق وقتك ومجال اهتمامك.
ومع الوقت، ستتعلم رؤية الأنماط، وربط الأفكار بين الأبحاث، وفهم الصورة الكبيرة بدل التعمق في التفاصيل الغير مفيدة.
ملاحظات مهمة رائعة ايضا:
- إذا كنت جديدا على قراءة الأبحاث، لا تستعجل. اختر أوراقًا مشهورة وابدأ بقراءتها ببطء، وابحث عن كل مصطلح غير مألوف حتى تكتسب الخبرة والسياق العلمي
- بعد تجاوز البداية الصعبة، ابدأ بالقراءة السريعة والمقارنة بين الأوراق لتطوّر أسلوبك الخاص في الت��ييز بينهم
- حتى أشهر الأوراق قد تحتوي على أخطاء، مثل ورقة Adam Optimizer التي استُخدمت لعقد كامل (بأكثر من 224,000 اقتباس) قبل تصحيحها، وFlashAttention-2 التي بقي فيها خطأ رياضي حتى الإصدار الثالث (للان موجود)
- لا تقرا سريعًا لدرجة تفقد الفهم العميق خصوصا ان بعض الأوراق تستحق الغوص فيها، خاصة الأوراق التأسيسية التي تغيّر فهمك للمجال مثل Transformers
- تعلم كيف تختار ما تقرأ: ليست المشكلة أنك لا تفهم الورقة، بل أحيانًا لأنها سيئة الكتابة أو غير مهمة. مواقع مثل AlphaXiv ممتازة لمعرفة الأوراق الشهيرة والمهمة بالمجتمع، وفرق مثل DeepSeek وHazy Research عادةً تقدم ابحاث واعمال ذات جودة عالية ومفيد��
وأخيرًا، استخدم أدوات الذكاء الاصطناعي كمساعد للفهم، لا كبديل للتفكير. الفهم الحقيقي يأتي من الجهد والسؤال لا من التلقين.
المقالة والمصدر:
https://t.co/8a3PNMZBTA
@masonwang025
"يُعاملك الله بما تُعامِل به الناس"
مَن يسهل على الناس يسهل الله له أموره
و مَن أحسن سيَلقى ا��إحسان
(الله في عون العبد ما كان العبد في عون أخيه)
اللهم انفعنا وانفع بنا، واجعلنا خيراً لمن حولنا🤍.
من أكثر الأبحاث انتشارا في مجتمع الذكاء الاصطناعي لعام 2025 هو مراجعة تقنية ضخمة بعنوان:
Advances and Challenges in Foundation Agents
مع تزايد الحديث عن الوكلاء (Agents) كأحد أهم توجهات الذكاء الاصطناعي اليوم، وأحد أكثر المهارات المطلوبة من مهندسين ومختصين المجال، تأتي هذه الورقة لتقدم خريطة شاملة للنماذج الذكية المستقلة المستوحاة من الدماغ البشري
الورقة بمساهمة من:
جامعة الملك عبدالله للعلوم والتقنية (كاوست) و Google و جامعة ستانفورد ومايكروسوفت والمزيد من الجهات والجامعات المتقدمة بالمجال
الورقة تمتد لأكثر من 350 صفحة وتدمج بين علوم الأعصاب�� و اساسيات الذكاء الاصطناعي، وعلم النفس المعرفي، لتقديم إطار عمل لبناء وكلاء قادرين على التفاعل والتطور بأمان في بيئات معقدة.
تتضمن الورقة ايضا تصنيف شامل لأنواع التعلم المستخدمة في بناء الوكلاء ، مثل التعلم بالإشراف، والتعلم التعزيزي، والتعلم الذاتي، وغيرها، مع توضيحات مرئية ومراجع لأبرز النماذج.
أبرز محاور الورقة:
- بنية الوكلاء (Modular Design):
تفصيل المكونات المستوحاة من وظائف الدماغ البشري مثل الذاكرة، بناء النموذج العقلي، العاطفة، والأهداف.
- التطور الذاتي (Self-Improvement):
كيف يتطور الوكلاء ويتعلمون بشكل مستمر ويتأقلمون مع البيئات العمل.
- التعاون متع��د الوكلاء (Multi-Agent Collaboration):
كيفية توليد ذكاء جماعي شبيه بالمجتمعات البشرية من خلال التفاعل والتعاون بين الوكلاء.
- السلامة والضبط الأخلاقي (Safety & Alignment):
معالجة تحديات مثل الهلوسة، الخصوصية، والهجمات، واقتراح إطار يوازن بين الأداء والسلامة للنماذج والوكلاء.
الورقة مليئة بالرسومات التوضيحية لكل محور، مما يجعلها مرجعًا رائعًا للمتعلمين البصريين والباحثين.
رابط الورقة:
https://t.co/Qys1nEAGMB
(تم نشرها في ابريل 2025 وتم تحديثها موخرا هذا الشهر)
كود المشروع والمصادر:
https://t.co/CJE2g1TzbP