كورس Advanced NLP من جامعة CMU لنسخة 2026.. كنز حقيقي لكل مهتم بالمجال:
1️⃣ بيغطي أحدث التطورات في معمارية الـ LLMs وتفاصيلها الهندسية.
2️⃣ تركيز قوي جداً على تقنيات الـ Inference المتقدمة وطرق التدريب.
3️⃣ بيناقش حلول عملية لأعقد التحديات البحثية اللي بنواجهها حالياً.
يسر مركز الدراسات المتقدمة في الذكاء الاصطناعي (ذكاء) في #جامعة_الملك_سعود وبالتعاون مع IBM الإعلان عن البرنامج التدريبي: وكلاء الذكاء الاصطناعي، وروبوتات الدردشة، والتوليد المعزَّز بالاسترجاع (RAG)
آخر موعد للتسجيل: 21 يونيو 2026
رابط التسجيل: https://t.co/YouPrjWSwa
#عام_الذكاء_الاصطناعي
#جامعة_الملك_سعود
تدشين أندية طويق @TuwaiqClubs في 16 جامعة حول المملكة!
وإطلاق 10 شراكات مع كبرى الجهات العالمية، و50 برنامج جديد خلال فترة الصيف؛ لبناء قدرات طلبة الجامعات وفقًا لسوق العمل.
🚨 Akademik araştırmalarda yapay zeka kullanımı yeni bir seviyeye taşındı!
Artık sadece basit prompt yazmak değil; Claude ve OpenAI modellerini gerçek akademik iş akışlarına entegre etmek mümkün.
Doç. Dr. Mehmet Songur’un paylaştığı bu rehber, literatür tarama, veri analizi, makale yazımı ve araştırma metodolojisi gibi kritik adımları AI ile profesyonelce yönetmek isteyenler için hazırlanmış.
🔗 GitHub: https://t.co/k6PGzSQV85
Akademisyenler ve araştırmacılar, bu codex’i mutlaka inceleyin. Sizce AI akademik üretkenliği ne kadar dönüştürecek? 👇
فصل #الدراسات_السابقة ” ليست قائمة مراجع طويلة، وليست مكانًا لاستعراض عدد الأوراق التي قرأتها. إنها الفصل الذي يجيب عن سؤال جوهري: لماذا يجب أن تُجرى هذه الدراسة أصلًا؟ أشارك في هذه السلسلة أهم الاستراتيجيات العملية لكتابة مراجعة أدبية قوية، تحليلية، ومقنعة في رسائل الماجستير والدكتوراه
(استثمار الرسالة العلمية)
يمكن استثمار الرسالة العلمية بالتنسيق مع المشرف العلمي، من خلال:
- نشر أبحاث مستلة من الرسالة.
- تأليف كتاب
- إعداد مقالات علمية ومهنية مختصرة.
- تقديم ورش عمل وبرامج تدريبية.
- المشاركة في المسابقات والمؤتمرات والملتقيات العلمية.
-تطوير أدلة أو حقائب تعليمية وتدريبية.
- بناء مشاريع وشراكات بحثية لاحقة.
- نشر المعرفة عبر المنصات الرقمية والشبكات الأكاديمية.
خلاصة:
رسالتك العلمية ليست نهاية الرحلة؛ بل بداية أثرها.
@ChemistMhmdJ@mimi89998 لك جزيل الشكر د. محمد،،
وايضا اذا حبيتي تضيفين التنبيهات على كلمات مفتاحية، تكتبين المصطلح أو الكلمة في شريط البحث في Google scolar
ثم من القائمة على اليسار Alert
ثم اختاري ايميل Gmail الخاص بك لتصلك كل الاوراق اللي تتطابق مع الكلمة المفتاحية اللي اخترتيها. 🌻
هذه المحاضرة من جامعة ستانفورد ومدتها ساعتان ستعلّمك عن كيفية بناء نماذج اللغة الكبيرة (LLMs) مثل ChatGPT وClaude أكثر مما يتعلمه معظم العاملين في كبرى شركات الذكاء الاصطناعي طوال مسيرتهم المهنية.
من أكثر الأوراق البحثية انتشارًا في مجتمع الذكاء الاصطناعي هذا الشهر وبداية هذا العام كانت ورقة تتحدث عن التسارع الكبير في قدرات نماذج الذكاء الاصطناعي والطلب المتزايد على تدريبها، حيث بدأنا نقترب من مشكلة شهيرة صارت تُعرف باسم “جدار البيانات (Data Wall)”: البيانات العامة عالية الجودة على الإنترنت تقترب من النفاد، بينما احتياج النماذج إلى البيانات يستمر بالتوسع
لفترة طويلة كان الافتراض العام في تدريب نماذج اللغة: انه كلما زدنا عدد وحدات التدريب (tokens) تحسّن النموذج (ولا يزال هذا صحيحًا جزئيًا في بعض الحالات)، لكن الواقع اليوم يفرض تحوّلًا مهمًا: المعادلة بدأت تنتقل من “المزيد من وحدات (tokens)” إلى “وحدات أفضل (tokens)” (المقصود بيانات ذات جودة افضل)
عنوان الورقة:
OPUS: Towards Efficient and Principled Data Selection in Large Language Model Pre-training in Every Iteration
فكرة الورقة بشكل مباشر: كثير من الحلول الحالية للتعامل مع “جدار البيانات” تقع في مسارين، وكلاهما غير كافي لوحده:
- المسار الأول (Static Filters): تنظيف/تصنيف البيانات قبل التدريب لاستبعاد الغير مرغوب بهم. مشكلته أنه قرار ثابت لا يتكيّف مع تغيّر احتياج النموذج عبر مراحل التدريب.
- المسار الثاني (Dynamic Selection): اختيار البيانات أثناء التدريب بناءً على مؤشرات سهلة القياس مثل الخسارة (loss function) أو “اتجاه التعلّم” الخام (raw gradients). المشكلة أن قرار التحديث الحقيقي في التدريب لا يعتمد على هذه الإشارات بشكل مباشر، لأنه يمر عبر المُحسّن (optimizer مثل AdamW) الذي يغيّر شكل واتجاه التحديث
اقتراح الورقة (Optimizer-aware): بدل الاعتماد على الخسارة فقط، تقترح الورقة اختيار العيّنات بحسب أثرها الحقيقي على التعلّم بعد المُحسّن (optimizer-aware): أي نختار البيانات التي تدفع النموذج “فعليًا” نحو التحسّن، مع تجنّب تكرار عينات متشابهة داخل الدفعة للحفاظ على التنوع.
تصوّر مبسّط:
بدل ما التدريب يستهلك بياناته بشكل عشوائي، الورقة تقترح إضافة “طبقة اختيار” داخل التدريب: في كل خطوة تُراجع مجموعة عينات قصيرة من البيانات وتختار فقط العينات التي تُعطي أكبر تحسّن فعلي للنموذج الآن (وتتجنب العينات المتشابهة). النتيجة: تدريب على بيانات أقل لكن أثرها أعلى.
النتائج كانت واضحة في جانب “الكفاءة”: في تجربة Qwen3-8B-Base على SciencePedia، حققت الورقة نتائج أفضل باستخدام 500 مليون وحدة تدريب (tokens) بدل 3 مليار وحدة أي بيانات أقل بحوالي 6×، وهذا يترجم عمليا إلى حوسبة أقل، وقت تدريب أقل، وتكلفة أقل مع أداء أعلى
الورقة تتجاوز 40 صفحة وفيها تفاصيل تقنية وتجارب كثيرة حاولت هنا تلخيص الفكرة الأساسية بأكبر قدر ممكن من الوضوح. إذا يهمك التعمّق أو الاطلاع على الأرقام والمنهجية كاملة، أنصح بقراءتها مباشرة:
https://t.co/xA3T4zPLdu