Tim Stephenson

@TimStephenson

Professional Wedding, Commercial & Lifestyle Photographer; Head of DevOps for Allies Computing (all views my own). Also:

Norwich, Norfolk, UK

Joined February 2009

982 Following

1.3K Followers

16.2K Posts

TimStephenson retweeted

Poonam Soni

@CodeByPoonam

about 1 month ago

Claude Opus 4.7 just got dethroned by a Chinese AI model. And nobody's talking about it. Kimi K2.6: → #1 coding model on OpenRouter → 7x cheaper than Claude Opus 4.7 → 100 sub-agents in parallel → 1,500 total steps per task Here's what happens when you build instead of hype

CodeByPoonam's tweet photo. Claude Opus 4.7 just got dethroned by a Chinese AI model.

And nobody's talking about it.

Kimi K2.6:
→ #1 coding model on OpenRouter
→ 7x cheaper than Claude Opus 4.7
→ 100 sub-agents in parallel
→ 1,500 total steps per task

Here's what happens when you build instead of hype

347

124

25K

TimStephenson retweeted

Teknium 🪽

@Teknium

about 1 month ago

Will be in Hermes Agent to try in the next hour or so 🤗😎

432

15K

TimStephenson retweeted

OpenAI

@OpenAI

about 1 month ago

Introducing GPT-5.5 A new class of intelligence for real work and powering agents, built to understand complex goals, use tools, check its work, and carry more tasks through to completion. It marks a new way of getting computer work done. Now available in ChatGPT and Codex.

52K

13M

Tim Stephenson @TimStephenson

about 2 months ago

Been testing K2.6 - impressive stuff so far!

Kimi.ai @Kimi_Moonshot

about 2 months ago

Meet Kimi K2.6: Advancing Open-Source Coding 🔹Open-source SOTA on HLE w/ tools (54.0), SWE-Bench Pro (58.6), SWE-bench Multilingual (76.7), BrowseComp (83.2), Toolathlon (50.0), Charxiv w/ python(86.7), Math Vision w/ python (93.2) What's new: 🔹Long-horizon coding - 4,000+ tool calls, over 12 hours of continuous execution, with generalization across languages (Rust, Go, Python) and tasks (frontend, devops, perf optimization). 🔹Motion-rich frontend - Videos in hero sections, WebGL shaders, GSAP + Framer Motion, Three.js 3D. 🔹Agent Swarms, elevated - 300 parallel sub-agents × 4,000 steps per run (up from K2.5's 100 / 1,500). One prompt, 100+ files. 🔹Proactive Agents - K2.6 model powers OpenClaw, Hermes Agent, etc for 24/7 autonomous ops. 🔹Claw Groups (research preview) - bring your own agents, command your friends', bots & humans in the loop. - K2.6 is now live on https://t.co/YutVbwktG0 in chat mode and agent mode. For production-grade coding, pair K2.6 with Kimi Code: https://t.co/uvoSJKyGCY - 🔗 API: https://t.co/EOZkbOwCN4 🔗 Tech blog: https://t.co/9wWvgIQSS3 🔗 Weights & code: https://t.co/Be0hjs2RTP

Kimi_Moonshot's tweet photo. Meet Kimi K2.6: Advancing Open-Source Coding

🔹Open-source SOTA on HLE w/ tools (54.0), SWE-Bench Pro (58.6), SWE-bench Multilingual (76.7), BrowseComp (83.2), Toolathlon (50.0), Charxiv w/ python(86.7), Math Vision w/ python (93.2)

What's new:
🔹Long-horizon coding - 4,000+ tool calls, over 12 hours of continuous execution, with generalization across languages (Rust, Go, Python) and tasks (frontend, devops, perf optimization).
🔹Motion-rich frontend - Videos in hero sections, WebGL shaders, GSAP + Framer Motion, Three.js 3D.
🔹Agent Swarms, elevated - 300 parallel sub-agents × 4,000 steps per run (up from K2.5's 100 / 1,500). One prompt, 100+ files.
🔹Proactive Agents - K2.6 model powers OpenClaw, Hermes Agent, etc for 24/7 autonomous ops.
🔹Claw Groups (research preview) - bring your own agents, command your friends', bots & humans in the loop.
-
K2.6 is now live on https://t.co/YutVbwktG0 in chat mode and agent mode.
For production-grade coding, pair K2.6 with Kimi Code: https://t.co/uvoSJKyGCY
-
🔗 API: https://t.co/EOZkbOwCN4
🔗 Tech blog: https://t.co/9wWvgIQSS3
🔗 Weights & code: https://t.co/Be0hjs2RTP

941

18K

Who to follow

Norfolk Local Wine School

@norfolk_wine

#NorfolkLocalWineSchool. We host fun, informative, #winetastings #beertastings, @WSETglobal courses, #corporateevents, #privateevnts and food & wine evenings

Paul Youngs

@PaulYoungs

The 'Print Expert' at Expert Print Management Ltd a Norwich based print management company. Drummer for The Blue Sueders and TGR

Chris Greenfield.

@chris_greenf

Have you ever wondered what the starry skies of @orfordnessnt look like with your camera or through a telescope?

TimStephenson retweeted

shirish

@shiri_shh

about 2 months ago

Hermes Agent is eating OpenClaw alive. 99k GitHub stars in 8 weeks. open source. self-improving. runs local. remembers everything.

shiri_shh's tweet photo. Hermes Agent is eating OpenClaw alive.

99k GitHub stars in 8 weeks.

open source. self-improving. runs local. remembers everything. https://t.co/APLmuTEl4Z

438

79K

TimStephenson retweeted

𝗠𝗼𝗵𝗮𝗺𝗲𝗱

@AIVibecode

about 2 months ago

عشان تشغل نماذج AI على جهازك فيه برنامجين يعتبرون الأفضل للمبتدئين LM Studio و Ollama. البرنامجين سهلين في التعامل مع كل التفاصيل التقنية المعقدة بالنيابة عنك. كل اللي عليك تسويه هو تنزيل البرنامج، تختار النموذج اللي تبغاه من قائمة جاهزة، وتضغط زر التحميل. بعد ما ينتهي التحميل، تقدر تبدأ محادثة مع النموذج مباشرة. مثال LM Studio أول شيء، تروح لموقعهم وتحمل البرنامج على جهازك سواء كان ويندوز أو ماك. بعد ما تشغله، راح تجد واجهة بسيطة فيها مربع بحث. تكتب اسم النموذج اللي تبغى تجربه، مثل Llama 3. راح تظهر لك قائمة طويلة من النسخ المختلفة من نفس النموذج، كل نسخة تم ضغطها بدرجة مختلفة. كبداية، ممكن تختار أي نسخة يكون في اسمها (Q4_K_M)، لأنها تقدم توازن ممتاز بين الحجم والأداء. تضغط تحميل، وتنتظر. بعد ما يخلص، تروح لقسم الدردشة في البرنامج، تختار النموذج اللي حملته من القائمة، وتبدأ تسأله أي شيء يخطر في بالك. بالنسبة لمتطلبات التشغيل، القاعدة الأساسية هي إن حجم ذاكرة الوصول العشوائي (RAM) أو ذاكرة كرت الشاشة (VRAM) لازم تكون أكبر بشوي من حجم ملف النموذج اللي حملته. لو حملت نموذج حجمه 4 جيجابايت، فأنت تحتاج يكون عندك على الأقل 8 جيجابايت من الرام في جهازك عشان يشتغل بشكل مريح. أغلب أجهزة اللابتوب الحديثة فيها 16 جيجابايت رام، وهذا كافي جداً لتشغيل نماذج بحجم 7 مليار بارامتر (7B). خلك عارف أن حجم الذاكرة المطلوب بالجيجابايت يساوي تقريباً عدد متغيرات النموذج بالمليار مضروب في حجم المتغير الواحد بالبت مقسوماً على ثمانية. أيضا لازم تعرف أن النماذج تأتي بأحجام مختلفة، تقاس بالمليارات من الـ Parameters أو المعاملات، مثلًا نموذج Llama 3 منه عدة نسخ منها 8B (ثمانية مليار معامل) و 70B (سبعين مليار معامل). و كل حجم ممكن يأتي بصيغ ضغط مختلفة مثل Q4, Q6, Q8, FP16. مثلا نموذج بصيغة FP16 معناها كل معامل يحتاج 16 بت. بالتالي حجم الذاكرة المطلوبة = (عدد المعاملات بالمليار) * (معامل ضغط النموذج / 8) يعني نموذج بحجم 7 مليار معامل بصيغة FP16 يحتاج حوالي 14 جيجابايت. ( 7 * (16/8)) = 14 طبعاً، كل ما زاد حجم النموذج، زادت دقته وقدرته، لكن في نفس الوقت زاد حجمه واحتياجه لموارد الجهاز. عشان كذا نلجأ للضغط أو Quantization. مثلاًَ لو ضغطنا نموذج 7 مليار لصيغة 8 بت، حجم الذاكرة راح يقل النصف تقريباً، يعني 7 جيجابايت. وعند ضغطه لـ 4 بت، يقل حجم الذاكرة المطلوب للربع، يعني حوالي 3.5 جيجابايت. بالمناسبة هذه الحسبة تقريبية، ذاكرة الجهاز ما تحمل فقط أوزان النموذج، نحتاج مساحة إضافية لأشياء أخرى مثل الـ KV Cache اللي يكبر مع طول المحادثة. القاعدة العامة هي أنك تحتاج دائماً ذاكرة إضافية بنسبة 10 إلى 30 بالمئة فوق الحجم الصافي للنموذج عشان يشتغل بسلاسة. أيضاً مهم أننا ننتبه لسرعة الذاكرة، أو الـ Bandwidth. هذه هي اللي تحدد سرعة توليد التوكينات. السعة تحدد لك إن كان النموذج راح يعمل، والسرعة تحدد إن كان استخدامه سلس. كروت الشاشة المنفصلة من إنفيديا، مثل RTX 5090، تملك أعلى عرض نطاق ترددي في السوق، ممكن يصل إلى 1.8 تيرابايت في الثانية. هذا يخليها قادرة على استدعاء البيانات من الذاكرة بسرعة هائلة، وبالتالي توليد التوكنز بسرعة فائقة. مشكلتها أن سعتها محدودة نسبياً، 32 جيجابايت مثلاً، وهذا راح يكون السقف لحجم النماذج اللي ممكن تشغيلها. في المقابل، أجهزة أبل مثل Mac Studio M3 Ultra تعتبر حل وسط. عرض النطاق الترددي فيها أقل، حوالي 800 جيجابايت في الثانية، لكنها تتيح لك الوصول إلى ذاكرة موحدة ضخمة تصل إلى 512 جيجابايت. هنا أنت تضحي بجزء من السرعة القصوى مقابل القدرة على تشغيل نماذج عملاقة جداً لا يمكن أن تتسع في أي كرت شاشة استهلاكي. أيضاً فيه فئة جديدة بدأت تظهر، وهي أجهزة الكمبيوتر بمعالجات مثل Strix Halo من AMD، واللي تقدم ذاكرة موحدة بسعة كبيرة تصل إلى 96 جيجابايت وعرض نطاق ترددي مقبول نسبياً، حوالي 256 جيجابايت في الثانية. هذه تمثل أول محاولة حقيقية لتقديم حل متكامل في عالم x86 ينافس فلسفة أبل. بالنسبة لـ AI PC أو أجهزة اللابتوب الخفيفة، فعرض النطاق الترددي فيها يعتبر منخفض جداً، وهذا يجعلها مناسبة للمساعدات الصغيرة والمهام البسيطة، وليس لتشغيل النماذج القوية. واذا كان عندك وقت وحاب تتعلم أكثر عن موضوع تشغيل نماذج الـ AI على جهازك راح أضع لك مقالين نصيحة أقرأهم راح تتعلم كثير خصوصا موضوع حساب الذاكرة ، كل ما كتبته هنا أخذته من هذين المقالين .

AIVibecode's tweet photo. عشان تشغل نماذج AI على جهازك فيه برنامجين يعتبرون الأفضل للمبتدئين LM Studio و Ollama. البرنامجين سهلين في التعامل مع كل التفاصيل التقنية المعقدة بالنيابة عنك.

كل اللي عليك تسويه هو تنزيل البرنامج، تختار النموذج اللي تبغاه من قائمة جاهزة، وتضغط زر التحميل. بعد ما ينتهي التحميل، تقدر تبدأ محادثة مع النموذج مباشرة.

مثال LM Studio أول شيء، تروح لموقعهم وتحمل البرنامج على جهازك سواء كان ويندوز أو ماك. بعد ما تشغله، راح تجد واجهة بسيطة فيها مربع بحث. تكتب اسم النموذج اللي تبغى تجربه، مثل Llama 3.

راح تظهر لك قائمة طويلة من النسخ المختلفة من نفس النموذج، كل نسخة تم ضغطها بدرجة مختلفة. كبداية، ممكن تختار أي نسخة يكون في اسمها (Q4_K_M)، لأنها تقدم توازن ممتاز بين الحجم والأداء.

تضغط تحميل، وتنتظر. بعد ما يخلص، تروح لقسم الدردشة في البرنامج، تختار النموذج اللي حملته من القائمة، وتبدأ تسأله أي شيء يخطر في بالك.

بالنسبة لمتطلبات التشغيل، القاعدة الأساسية هي إن حجم ذاكرة الوصول العشوائي (RAM) أو ذاكرة كرت الشاشة (VRAM) لازم تكون أكبر بشوي من حجم ملف النموذج اللي حملته.

لو حملت نموذج حجمه 4 جيجابايت، فأنت تحتاج يكون عندك على الأقل 8 جيجابايت من الرام في جهازك عشان يشتغل بشكل مريح. أغلب أجهزة اللابتوب الحديثة فيها 16 جيجابايت رام، وهذا كافي جداً لتشغيل نماذج بحجم 7 مليار بارامتر (7B).

خلك عارف أن حجم الذاكرة المطلوب بالجيجابايت يساوي تقريباً عدد متغيرات النموذج بالمليار مضروب في حجم المتغير الواحد بالبت مقسوماً على ثمانية.

أيضا لازم تعرف أن النماذج تأتي بأحجام مختلفة، تقاس بالمليارات من الـ Parameters أو المعاملات، مثلًا نموذج Llama 3 منه عدة نسخ منها 8B (ثمانية مليار معامل) و 70B (سبعين مليار معامل).

و كل حجم ممكن يأتي بصيغ ضغط مختلفة مثل Q4, Q6, Q8, FP16. مثلا نموذج بصيغة FP16 معناها كل معامل يحتاج 16 بت.

بالتالي حجم الذاكرة المطلوبة = (عدد المعاملات بالمليار) * (معامل ضغط النموذج / 8)

يعني نموذج بحجم 7 مليار معامل بصيغة FP16 يحتاج حوالي 14 جيجابايت. ( 7 * (16/8)) = 14

طبعاً، كل ما زاد حجم النموذج، زادت دقته وقدرته، لكن في نفس الوقت زاد حجمه واحتياجه لموارد الجهاز. عشان كذا نلجأ للضغط أو Quantization.

مثلاًَ لو ضغطنا نموذج 7 مليار لصيغة 8 بت، حجم الذاكرة راح يقل النصف تقريباً، يعني 7 جيجابايت. وعند ضغطه لـ 4 بت، يقل حجم الذاكرة المطلوب للربع، يعني حوالي 3.5 جيجابايت.

بالمناسبة هذه الحسبة تقريبية، ذاكرة الجهاز ما تحمل فقط أوزان النموذج، نحتاج مساحة إضافية لأشياء أخرى مثل الـ KV Cache اللي يكبر مع طول المحادثة.

القاعدة العامة هي أنك تحتاج دائماً ذاكرة إضافية بنسبة 10 إلى 30 بالمئة فوق الحجم الصافي للنموذج عشان يشتغل بسلاسة.

أيضاً مهم أننا ننتبه لسرعة الذاكرة، أو الـ Bandwidth. هذه هي اللي تحدد سرعة توليد التوكينات. السعة تحدد لك إن كان النموذج راح يعمل، والسرعة تحدد إن كان استخدامه سلس.

كروت الشاشة المنفصلة من إنفيديا، مثل RTX 5090، تملك أعلى عرض نطاق ترددي في السوق، ممكن يصل إلى 1.8 تيرابايت في الثانية.

هذا يخليها قادرة على استدعاء البيانات من الذاكرة بسرعة هائلة، وبالتالي توليد التوكنز بسرعة فائقة. مشكلتها أن سعتها محدودة نسبياً، 32 جيجابايت مثلاً، وهذا راح يكون السقف لحجم النماذج اللي ممكن تشغيلها.

في المقابل، أجهزة أبل مثل Mac Studio M3 Ultra تعتبر حل وسط. عرض النطاق الترددي فيها أقل، حوالي 800 جيجابايت في الثانية، لكنها تتيح لك الوصول إلى ذاكرة موحدة ضخمة تصل إلى 512 جيجابايت.

هنا أنت تضحي بجزء من السرعة القصوى مقابل القدرة على تشغيل نماذج عملاقة جداً لا يمكن أن تتسع في أي كرت شاشة استهلاكي.

أيضاً فيه فئة جديدة بدأت تظهر، وهي أجهزة الكمبيوتر بمعالجات مثل Strix Halo من AMD، واللي تقدم ذاكرة موحدة بسعة كبيرة تصل إلى 96 جيجابايت وعرض نطاق ترددي مقبول نسبياً، حوالي 256 جيجابايت في الثانية.

هذه تمثل أول محاولة حقيقية لتقديم حل متكامل في عالم x86 ينافس فلسفة أبل.

بالنسبة لـ AI PC أو أجهزة اللابتوب الخفيفة، فعرض النطاق الترددي فيها يعتبر منخفض جداً، وهذا يجعلها مناسبة للمساعدات الصغيرة والمهام البسيطة، وليس لتشغيل النماذج القوية.

واذا كان عندك وقت وحاب تتعلم أكثر عن موضوع تشغيل نماذج الـ AI على جهازك راح أضع لك مقالين نصيحة أقرأهم راح تتعلم كثير خصوصا موضوع حساب الذاكرة ، كل ما كتبته هنا أخذته من هذين المقالين .

192

215

17K

TimStephenson retweeted

David Hendrickson

@TeksEdge

about 2 months ago

April Model Releases (updated) 😵‍💫 - Meta Muse Spark ✅ - Deepseek V4 (waiting) - GPT-5.5 or (“Spud”) - This week? - Claude 5 or (“Mythos”) - This week? - Gemma 4 series✅ - Trinity Large Thinking (🇺🇸) ✅ - 1-bit Bonsai 8B (🇺🇸) ✅ - Holo3 (🇫🇷) ✅ - Qwen3.6-Plus✅ - Qwen3.5 Max Pro✅ - Qwen3.5 Omni Plus✅ - Gemini 3.1 Flash Live ✅ - GLM-5.1 open ✅ - GLM-5V-Turbo✅ - Sarvam 105B and Sarvam 30B (🇮🇳) ✅ - MAI-Transcribe-1, MAI-Voice/IMAGE-1 ✅ - MiniMax M2.7 open weights ✅ - MiniMax M3.0 - Kimi K3.0 - StepFun - Hunyuan 30B MoE

734

237

63K

TimStephenson retweeted

Ian Mckay @iann0036

about 2 months ago

Hey @awscloud, a new API should NOT be a health event. Stop waking people up with spam.

389

23K

Tim Stephenson @TimStephenson

about 2 months ago

Been battling that one all day. Gave up and switched to GLM-5.1 instead!

illu

@illuvanati

about 2 months ago

@claudeai This is all I have to say

991

49K

TimStephenson retweeted

Agents FM

@AgentsFM

about 2 months ago

@claudeai That's cool and all but your entire status page is orange right now. Shipping new products while https://t.co/URY9MRDn51, Claude Code, Cowork, and the API are all showing Degraded Performance simultaneously is certainly a choice. 🙄

AgentsFM's tweet photo. @claudeai That's cool and all but your entire status page is orange right now. Shipping new products while https://t.co/URY9MRDn51, Claude Code, Cowork, and the API are all showing Degraded Performance simultaneously is certainly a choice. 🙄 https://t.co/6iAMUaMcKs

106

24K

Tim Stephenson @TimStephenson

about 2 months ago

Nice idea but pointless if it uses the same irritatingly low rate limits.

BentoBoi

@BentoBoiNFT

about 2 months ago

Anthropic banned OpenClaw from using Claude subscriptions 4 days ago Today they just launched their own managed agents platform So basically OpenClaw without all the headache and cheaper usage

127

584

329K

290

TimStephenson retweeted

Nous Research

@NousResearch

about 2 months ago

Hermes Agent v0.8.0 is here. Full changelog below ↓

191

224

847

278K

TimStephenson retweeted

Alibaba Cloud

@alibaba_cloud

2 months ago

Introducing Qwen3.6-Plus: Towards Real-World Agents! Here is what makes Qwen3.6-Plus a game-changer： · Next-level Agentic Coding · Enhanced Multimodal Vision · Top-tier Performance: · 1M Context Window Noted: More Qwen3.6 models to come and be open-sourced! Stay tuned!

alibaba_cloud's tweet photo. Introducing Qwen3.6-Plus: Towards Real-World Agents!

Here is what makes Qwen3.6-Plus a game-changer：
· Next-level Agentic Coding
· Enhanced Multimodal Vision
· Top-tier Performance:
· 1M Context Window

Noted: More Qwen3.6 models to come and be open-sourced! Stay tuned!

131

326

TimStephenson retweeted

go4gordon 🌕 @go4gordon

2 months ago

NASA appears to be centralizing a lot of their high-resolution Artemis II media at this link. A good one to keep in your bookmarks. https://t.co/5xBvnDaB92

724

852K

TimStephenson retweeted

ERNEST CF @ErnestCalFab

2 months ago

Everyday Astronaut (arriba) VS Director oficial de la NASA (abajo). Que un youtuber sea capaz de darnos mejores imágenes que la agencia espacial más importante del mundo no tiene ningún sentido. 🤦‍♂️🤦‍♂️🤦‍♂️

ErnestCalFab's tweet photo. Everyday Astronaut (arriba) VS Director oficial de la NASA (abajo).
Que un youtuber sea capaz de darnos mejores imágenes que la agencia espacial más importante del mundo no tiene ningún sentido.
🤦‍♂️🤦‍♂️🤦‍♂️ https://t.co/D7DykhWYXZ

126

46K

TimStephenson retweeted

Booster 10

@booster_10

2 months ago

NASA should be extremely embarrassed at how much better Everyday Astronaut's coverage of the launch was compared to theirs.

178

274

213K

TimStephenson retweeted

Brian Hart @BrianTHart

2 months ago

This is a truly incredible shot, especially given that the NASA live feed chose to show video of the cheering crowd right at the exact moment of solid rocket booster separation…

BrianTHart's tweet photo. This is a truly incredible shot, especially given that the NASA live feed chose to show video of the cheering crowd right at the exact moment of solid rocket booster separation… https://t.co/elWx1HRkzl

255

26K

813K

TimStephenson retweeted

Sawyer Merritt

@SawyerMerritt

2 months ago

Difference in quality between NASA and SpaceX’s launch livestreams.

20K

Tim Stephenson @TimStephenson

2 months ago

Brilliant to see the Artemis II mission launch @NASA - but for the love of all things space, spend a few $$ more on the cameras next time 'eh and perhaps talk to @SpaceX about @Starlink ? If this is the pinnacle of your technology isn't it a touch embarrassing?

TimStephenson's tweet photo. Brilliant to see the Artemis II mission launch @NASA - but for the love of all things space, spend a few $$ more on the cameras next time 'eh and perhaps talk to @SpaceX about @Starlink ? If this is the pinnacle of your technology isn't it a touch embarrassing? https://t.co/pe0sds8umc

TimStephenson retweeted

frederick

@spcpza

2 months ago

Hermes is so so so much better than openclaw. The persistent memory lets me do things openclaw couldn’t do. Thanks @NousResearch!!

194

19K

Tim Stephenson

@TimStephenson

Who to follow

Last Seen Users on Sotwe

Trends for you

Most Popular Users