مَجد

Software Engineer @HudHudMaps | MSc Data Science | @lammagames

about 3 years ago

#Threads 💻

12K

Mcyber20 retweeted

@3nvv6

9 days ago

العيب الوحيد انها مو عندي

124

133

331K

Mcyber20 retweeted

Jahez Digital Hub

@JahezDigital

13 days ago

Ready to level up? 🚀 Join NODE’s info session this Saturday, get inspired, and see what’s waiting for you. See you there: https://t.co/UQhWk4g6Tj

408

Mcyber20 retweeted

Jahez Digital Hub

@JahezDigital

28 days ago

Your next big project starts with one NODE. Begin your journey now 🚀

822

Who to follow

empty

@_x1337

SOC Shift Lead | Skilled in IR & Threat Hunting | Certified in #eCPPT, #eCIR, #eCTHP & #OSDA | Always learning & staying ahead of the game.

Mcyber20 retweeted

فــذكِّر

@thkkkrr_

6 months ago

339

520

92K

6 months ago

Mcyber20's tweet photo. https://t.co/PYGMvBnZs3

7 months ago

بونجور يادُنيا ☀️!

120

8 months ago

So interesting!!🫨

8 months ago

أغلب الأوراق البحثية في الذكاء الاصطناعي اليوم تُظهر النتيجة النهائية فقط: نموذج قوي، أرقام مرتفعة، وتجارب ناجحة لكنها لا تُظهر تفاصيل وتحديات الرحلة نفسها خلال التطوير مثل الأخطاء، الساعات الطويلة في إصلاح مشاكل مثل الـdataloader، أو الارتفاعات المفاجئة في الـloss التي تؤثر سلبا على التدريب، أو الأعطال الدقيقة في التوازي (tensor parallelism) أو بين ال GPUs التي قد تفسد التجربة بالكامل بعد أيّام من التدريب ولسد هذه الفجوة، نشرت Hugging Face مدونة مميزة جدا واراها من أصدق واشمل المدونات اللي مرت علي بعنوان: The Smol Training Playbook: The Secrets to Building World-Class LLMs تأخذ القارئ والمتعلم خلف كواليس تطوير النماذج اللغوية لتوضح التجربة الكاملة لتدريب نموذج مثل SmolLM3 (3B) على أكثر من 11 تريليون وحدة (Token)، وتشرح بالتفصيل القرارات، التحديات، والإخفاقات والاخطاء التي لا تُذكر عادة في الأوراق الأكاديمية المحتوى مليان بالتفاصيل العملية، من تصميم المعمارية لتحسين الكفاءة والاستقرار، إلى توزيع البيانات (Data Mixtures) لاختبار تأثير مصادر البيانات على جودة النموذج وتوازنه، وقوانين التوسّع (Scaling Laws) لفهم العلاقة بين حجم النموذج وكمية البيانات، وصولاً إلى كيفية اتخاذ القرارات أثناء التجربة بناءً على الملاحظات والنتائج الواقعية ✅ واحدة من أصدق وأشمل المراجع لأي شخص يريد أن يفهم او يتعلم فعلاً كيف تُبنى نماذج الذكاء الاصطناعي من البداية للنهاية. أنصح بقراءتها بشدة https://t.co/Cc5P6JEkwU

Sa4d_k1's tweet photo. أغلب الأوراق البحثية في الذكاء الاصطناعي اليوم تُظهر النتيجة النهائية فقط: نموذج قوي، أرقام مرتفعة، وتجارب ناجحة

لكنها لا تُظهر تفاصيل وتحديات الرحلة نفسها خلال التطوير مثل الأخطاء، الساعات الطويلة في إصلاح مشاكل مثل الـdataloader، أو الارتفاعات المفاجئة في الـloss التي تؤثر سلبا على التدريب، أو الأعطال الدقيقة في التوازي (tensor parallelism) أو بين ال GPUs التي قد تفسد التجربة بالكامل بعد أيّام من التدريب

ولسد هذه الفجوة، نشرت Hugging Face مدونة مميزة جدا واراها من أصدق واشمل المدونات اللي مرت علي بعنوان:

The Smol Training Playbook: The Secrets to Building World-Class LLMs

تأخذ القارئ والمتعلم خلف كواليس تطوير النماذج اللغوية لتوضح التجربة الكاملة لتدريب نموذج مثل SmolLM3 (3B) على أكثر من 11 تريليون وحدة (Token)، وتشرح بالتفصيل القرارات، التحديات، والإخفاقات والاخطاء التي لا تُذكر عادة في الأوراق الأكاديمية

المحتوى مليان بالتفاصيل العملية، من تصميم المعمارية لتحسين الكفاءة والاستقرار، إلى توزيع البيانات (Data Mixtures) لاختبار تأثير مصادر البيانات على جودة النموذج وتوازنه، وقوانين التوسّع (Scaling Laws) لفهم العلاقة بين حجم النموذج وكمية البيانات، وصولاً إلى كيفية اتخاذ القرارات أثناء التجربة بناءً على الملاحظات والنتائج الواقعية

✅ واحدة من أصدق وأشمل المراجع لأي شخص يريد أن يفهم او يتعلم فعلاً كيف تُبنى نماذج الذكاء الاصطناعي من البداية للنهاية.
أنصح بقراءتها بشدة
https://t.co/Cc5P6JEkwU

324

263

22K

231

8 months ago

Not surprised at all, but the way it recovers the text is worth a read!

Alex Veremeyenko

@alex_verem

8 months ago

holy sh*t... your llm remembers everything you typed 🤯 researchers just proved you can recover the EXACT input text from a language model's hidden states. not similar text. not approximate. the actual words you typed. here's what they found: • transformer language models are mathematically injective • different inputs = different hidden states (with probability 1) • this isn't a coincidence or training artifact, it's structural • they built SIPIT, an algorithm that inverts the model in linear time • tested on billions of prompts across GPT-2, Gemma, Llama • 100% exact recovery rate. zero collisions found. the math is airtight. transformers are real-analytic functions, which means collisions can only happen on measure-zero parameter sets. at random init? probability zero. after gradient descent? still zero. you cannot accidentally make these models lossy. the information doesn't compress. it doesn't abstract. it just transforms into a different representation that perfectly preserves every token. your prompt never leaves the model. it just lives in 768 dimensions instead of text. this changes everything about how we think about llm internals, interpretability, and what "representations" actually mean.

alex_verem's tweet photo. holy sh*t... your llm remembers everything you typed 🤯

researchers just proved you can recover the EXACT input text from a language model's hidden states.

not similar text. not approximate.

the actual words you typed.

here's what they found:
• transformer language models are mathematically injective
• different inputs = different hidden states (with probability 1)
• this isn't a coincidence or training artifact, it's structural
• they built SIPIT, an algorithm that inverts the model in linear time
• tested on billions of prompts across GPT-2, Gemma, Llama
• 100% exact recovery rate. zero collisions found.

the math is airtight.

transformers are real-analytic functions, which means collisions can only happen on measure-zero parameter sets.

at random init?
probability zero.

after gradient descent?
still zero.

you cannot accidentally make these models lossy.

the information doesn't compress. it doesn't abstract.

it just transforms into a different representation that perfectly preserves every token.

your prompt never leaves the model. it just lives in 768 dimensions instead of text.

this changes everything about how we think about llm internals, interpretability, and what "representations" actually mean.

212

443

330K

178

8 months ago

@Sa4d_k1 Interesting!

147

Mcyber20 retweeted

8 months ago

نحن في فترة تتسارع فيها التطورات العلمية والذكاء الاصطناعي، وتتزايد فيها كمية المعلومات بما يفوق قدرة أي إنسان على الاستيعاب، لم يعد الذكاء أن تعرف او تستوعب كل شيء، بل اصبح أن تتعلّم بسرعة، وتتأقلم باستمرار، وتعيد تشكيل نفسك كلما تغيّر العالم مع التطورات السريعة وطننا اليوم مليء بالفرص، أكثر من أي وقت سابق، لكنها لا تنتظر أحد. من يتأقلم أسرع هو من يحصدها، ومن يتأخر عن التعلم والتغيير، يتراجع مهما كانت خبرته أو ذكاؤه الذكاء لم يعد يقاس بدرجة ذكائك المنطقي أو العاطفي، بل بقدرتك على التكيف، بما يُعرف بـ Adaptability Quotient او (AQ)، وهي مهارة البقاء والتطور والتاقلم في عالم لا يتوقف عن التحوّل. فالعقل بطبيعته يقاوم التغيير، لأنه يرى في الجديد تهديد وليس فرصة. لكن مع كل تجربة جديدة، وكل محاولة، وكل خطوة صغيرة نحو المجهول، يُعاد تشكيل طريقة تفكيره ليصبح أكثر مرونةً وثقة بالمستقبل حينما نفكر عن الشركات التي نجت وسط الثورات التقنية، أو الأشخاص الذين أعادوا ابتكار أنفسهم في عالمٍ يتبدل بسرعة. ما ميّزهم لم يكن ذكاءهم، بل قدرتهم على التعلم الدائم والتاقلم بسرعة، والمرونة أمام المتغيرات، والشجاعة في مواجهة الفشل. ومن الامثلة الرهيبه Google Moonshot Factory (وهو مختبر شهير للابتكار والاختراع) ، يحتفلون بالفشل لأنهم يعلمون أن كل محاولة غير ناجحة هي خطوة نحو اكتشاف جديد وسُمّيت Google Moonshot Factory بهذا الاسم لأنها ترمز إلى السعي نحو للأهداف المستحيلة التي تتطلب تجربة، وتكيّف مستمر مع المجهول

Sa4d_k1's tweet photo. نحن في فترة تتسارع فيها التطورات العلمية والذكاء الاصطناعي، وتتزايد فيها كمية المعلومات بما يفوق قدرة أي إنسان على الاستيعاب، لم يعد الذكاء أن تعرف او تستوعب كل شيء، بل اصبح أن تتعلّم بسرعة، وتتأقلم باستمرار، وتعيد تشكيل نفسك كلما تغيّر العالم مع التطورات السريعة

وطننا اليوم مليء بالفرص، أكثر من أي وقت سابق، لكنها لا تنتظر أحد. من يتأقلم أسرع هو من يحصدها، ومن يتأخر عن التعلم والتغيير، يتراجع مهما كانت خبرته أو ذكاؤه

الذكاء لم يعد يقاس بدرجة ذكائك المنطقي أو العاطفي، بل بقدرتك على التكيف، بما يُعرف بـ Adaptability Quotient او (AQ)، وهي مهارة البقاء والتطور والتاقلم في عالم لا يتوقف عن التحوّل. فالعقل بطبيعته يقاوم التغيير، لأنه يرى في الجديد تهديد وليس فرصة. لكن مع كل تجربة جديدة، وكل محاولة، وكل خطوة صغيرة نحو المجهول، يُعاد تشكيل طريقة تفكيره ليصبح أكثر مرونةً وثقة بالمستقبل

حينما نفكر عن الشركات التي نجت وسط الثورات التقنية، أو الأشخاص الذين أعادوا ابتكار أنفسهم في عالمٍ يتبدل بسرعة. ما ميّزهم لم يكن ذكاءهم، بل قدرتهم على التعلم الدائم والتاقلم بسرعة، والمرونة أمام المتغيرات، والشجاعة في مواجهة الفشل. ومن الامثلة الرهيبه Google Moonshot Factory (وهو مختبر شهير للابتكار والاختراع) ، يحتفلون بالفشل لأنهم يعلمون أن كل محاولة غير ناجحة هي خطوة نحو اكتشاف جديد وسُمّيت Google Moonshot Factory بهذا الاسم لأنها ترمز إلى السعي نحو للأهداف المستحيلة التي تتطلب تجربة، وتكيّف مستمر مع المجهول

Mcyber20 retweeted

8 months ago

من افضل ما قرأت، وهي مقالة قصيرة مدتها ٥ دقائق عن كيف تقرأ ورقة بحثية او مقالة ذكاء اصطناعي بذكاء وسرعة وهي من اهم المهارات في الزمان الحالي خصوصا عدد الأبحاث والمقالات في الذكاء الاصطناعي أصبح ضخما جدا، ولا يمكننا قراءتها كلها ببطء واستيعابها، ومعظمها متشابه أو ضعيفة المحتوى وفي هذه المقالة الكاتب يوضح أن الحل ليس في قراءة كل ورقة، بل في اكتساب مهارة التصفية السريعة: اقرأ كثيرًا وبسرعة لتكوّن وتتعلم طريقة تمييز الأوراق الجيدة من العادية طريقة القراءة الذكية تمر بثلاث مراحل: - الفكرة العامة: ما الهدف من الورقة ولماذا أُجريت؟ - النتائج والأدلة: هل ما يعرضونه فعلا مقنع؟ - التفاصيل: تعمّق فقط إن كانت الورقة تستحق وقتك ومجال اهتمامك. ومع الوقت، ستتعلم رؤية الأنماط، وربط الأفكار بين الأبحاث، وفهم الصورة الكبيرة بدل التعمق في التفاصيل الغير مفيدة. ملاحظات مهمة رائعة ايضا: - إذا كنت جديدا على قراءة الأبحاث، لا تستعجل. اختر أوراقًا مشهورة وابدأ بقراءتها ببطء، وابحث عن كل مصطلح غير مألوف حتى تكتسب الخبرة والسياق العلمي - بعد تجاوز البداية الصعبة، ابدأ بالقراءة السريعة والمقارنة بين الأوراق لتطوّر أسلوبك الخاص في الت��ييز بينهم - حتى أشهر الأوراق قد تحتوي على أخطاء، مثل ورقة Adam Optimizer التي استُخدمت لعقد كامل (بأكثر من 224,000 اقتباس) قبل تصحيحها، وFlashAttention-2 التي بقي فيها خطأ رياضي حتى الإصدار الثالث (للان موجود) - لا تقرا سريعًا لدرجة تفقد الفهم العميق خصوصا ان بعض الأوراق تستحق الغوص فيها، خاصة الأوراق التأسيسية التي تغيّر فهمك للمجال مثل Transformers - تعلم كيف تختار ما تقرأ: ليست المشكلة أنك لا تفهم الورقة، بل أحيانًا لأنها سيئة الكتابة أو غير مهمة. مواقع مثل AlphaXiv ممتازة لمعرفة الأوراق الشهيرة والمهمة بالمجتمع، وفرق مثل DeepSeek وHazy Research عادةً تقدم ابحاث واعمال ذات جودة عالية ومفيد�� وأخيرًا، استخدم أدوات الذكاء الاصطناعي كمساعد للفهم، لا كبديل للتفكير. الفهم الحقيقي يأتي من الجهد والسؤال لا من التلقين. المقالة والمصدر: https://t.co/8a3PNMZBTA @masonwang025

Sa4d_k1's tweet photo. من افضل ما قرأت، وهي مقالة قصيرة مدتها ٥ دقائق عن كيف تقرأ ورقة بحثية او مقالة ذكاء اصطناعي بذكاء وسرعة وهي من اهم المهارات في الزمان الحالي
خصوصا عدد الأبحاث والمقالات في الذكاء الاصطناعي أصبح ضخما جدا، ولا يمكننا قراءتها كلها ببطء واستيعابها، ومعظمها متشابه أو ضعيفة المحتوى

وفي هذه المقالة الكاتب يوضح أن الحل ليس في قراءة كل ورقة، بل في اكتساب مهارة التصفية السريعة:

اقرأ كثيرًا وبسرعة لتكوّن وتتعلم طريقة تمييز الأوراق الجيدة من العادية
طريقة القراءة الذكية تمر بثلاث مراحل:

- الفكرة العامة: ما الهدف من الورقة ولماذا أُجريت؟
- النتائج والأدلة: هل ما يعرضونه فعلا مقنع؟
- التفاصيل: تعمّق فقط إن كانت الورقة تستحق وقتك ومجال اهتمامك.

ومع الوقت، ستتعلم رؤية الأنماط، وربط الأفكار بين الأبحاث، وفهم الصورة الكبيرة بدل التعمق في التفاصيل الغير مفيدة.

ملاحظات مهمة رائعة ايضا:
- إذا كنت جديدا على قراءة الأبحاث، لا تستعجل. اختر أوراقًا مشهورة وابدأ بقراءتها ببطء، وابحث عن كل مصطلح غير مألوف حتى تكتسب الخبرة والسياق العلمي

- بعد تجاوز البداية الصعبة، ابدأ بالقراءة السريعة والمقارنة بين الأوراق لتطوّر أسلوبك الخاص في الت��ييز بينهم

- حتى أشهر الأوراق قد تحتوي على أخطاء، مثل ورقة Adam Optimizer التي استُخدمت لعقد كامل (بأكثر من 224,000 اقتباس) قبل تصحيحها، وFlashAttention-2 التي بقي فيها خطأ رياضي حتى الإصدار الثالث (للان موجود)

- لا تقرا سريعًا لدرجة تفقد الفهم العميق خصوصا ان بعض الأوراق تستحق الغوص فيها، خاصة الأوراق التأسيسية التي تغيّر فهمك للمجال مثل Transformers

- تعلم كيف تختار ما تقرأ: ليست المشكلة أنك لا تفهم الورقة، بل أحيانًا لأنها سيئة الكتابة أو غير مهمة. مواقع مثل AlphaXiv ممتازة لمعرفة الأوراق الشهيرة والمهمة بالمجتمع، وفرق مثل DeepSeek وHazy Research عادةً تقدم ابحاث واعمال ذات جودة عالية ومفيد��

وأخيرًا، استخدم أدوات الذكاء الاصطناعي كمساعد للفهم، لا كبديل للتفكير. الفهم الحقيقي يأتي من الجهد والسؤال لا من التلقين.

المقالة والمصدر:
https://t.co/8a3PNMZBTA
@masonwang025

542

551

29K

8 months ago

زكاة العلم نشره 🌷🌷

166

Mcyber20 retweeted

مُزدانَةْ

@_mzdanh

8 months ago

"يُعاملك الله بما تُعامِل به الناس" مَن يسهل على الناس يسهل الله له أموره و مَن أحسن سيَلقى ا��إحسان (الله في عون العبد ما كان العبد في عون أخيه) اللهم انفعنا وانفع بنا، واجعلنا خيراً لمن حولنا🤍.

654

412

126K

8 months ago

انفلونزا للمره المليون اخ تعبت وانا اتعب

386

8 months ago

Coffee Coffee Coffee

124

8 months ago

Just bought a new book ✨

124

8 months ago

Wooow!

OpenAI

@OpenAI

8 months ago

You can now chat with apps in ChatGPT.

33K

276

9 months ago

listening to the Sweet Boys podcast in 2025

152

Mcyber20 retweeted

نادي طويق

@TuwaiqClubs

10 months ago

لتمكين الطلاب بالمهارات التقنيّة المطلوبة بسوق العمل؛ نسعد بإطلاق #نادي_طويق بالشراكة بين @TuwaiqAcademy و@IMSIU_edu_sa. للتسجيل: https://t.co/qFO8QNdPV3

TuwaiqClubs's tweet photo. لتمكين الطلاب بالمهارات التقنيّة المطلوبة بسوق العمل؛ نسعد بإطلاق #نادي_طويق بالشراكة بين @TuwaiqAcademy و@IMSIU_edu_sa.

للتسجيل: https://t.co/qFO8QNdPV3 https://t.co/dSo1Qkmze8

155

45K

Mcyber20 retweeted