“NUCLEAR FUSION Half a Century of Magnetic Confinement
Fusion Research” by C M Braams and P E Stott
A really interesting deep dive into the first 50 years of magnetic confinement fusion research and covers plasma physics and tokamaks pretty decently too.
I found it also online for free if you want to read it, it is a little long though, enjoy.
Source ☢️: https://t.co/zyjInlJ9Fy
📚 "Lire, longtemps, sans s’interrompre ou être interrompu est devenu, en quelques années, une tâche plus difficile à accomplir. Un «grand lecteur» comme William Marx, titulaire de la chaire Littératures comparées au Collège de France, doit s’y contraindre."
https://t.co/67A0bCqtWz
« Si vous m’aviez demandé il y a un ou deux ans s’il s’agit d’un changement civilisationnel, je vous aurais dit non. Aujourd’hui, j’ai changé d’avis. Je vois sur moi-même l’effet de ces technologies. »
(…)
« Orwell craignait ceux qui interdiraient les livres. Huxley redoutait qu’il n’y ait même plus besoin d’interdire les livres car plus personne n’aurait envie d’en lire. (…) [George] Orwell craignait qu’on nous cache la vérité. [Aldous] Huxley redoutait que la vérité ne soit noyée dans un océan d’insignifiance. » En 1985, un théoricien des médias américain du nom de Neil Postman publiait un essai retentissant intitulé Se distraire à en mourir (Fayard, 2011), dans lequel il dénonçait « le fait le plus significatif de la culture américaine de la deuxième moitié du XXe siècle : le déclin de l’âge de la typographie et l’essor de l’âge de la télévision ».
Toute une culture du débat démocratique liée à la diffusion de l’écrit allait s’abîmer dans un espace public désormais dévoré par le divertissement, avertissait-il. Loin des autodafés et de la censure que l’on associe aux régimes autoritaires, l’avènement de l’âge de la télévision, en nous rivant devant nos écrans, avait définitivement fait gagner la prophétie d’Aldous Huxley (1894-1963) contre celle de George Orwell (1903-1950).
Vues d’aujourd’hui, les années 1980 passent pour un temps béni : celui d’avant l’intelligence artificielle (IA), Internet et les smartphones, dont il est désormais prouvé que leur simple présence dans la pièce diminue la capacité de concentration. Une époque où la télévision s’arrêtait à minuit et où les téléphones, fixes, servaient seulement à téléphoner. »
(…)
« Où s’arrêtera ce déclin de la lecture ? Se pourrait-il que nous soyons entrés dans une ère « post-lettrée » ? Le terme de « post-literate society » est né en 1962 chez le théoricien canadien des médias Marshall McLuhan, dans La Galaxie Gutenberg (Gallimard, 1977). Selon McLuhan, toute nouvelle technologie rend obsolète la précédente, tout en en faisant renaître une plus ancienne encore. Vingt ans avant Neil Postman, Marshall McLuhan parlait déjà, avec l’entrée dans l’âge électronique, de la fin de l’« homme typographique » et d’un retour à une forme d’oralité : celle d’une société où la capacité de lire et d’écrire existe toujours, mais, devenue une pratique minoritaire, cesse de structurer la manière dont nous pensons.
Cette analyse est reprise aujourd’hui sur un mode bien plus alarmiste par le critique culturel britannique du Times James Marriott, auteur de The New Dark Age : The End of Reading and The Dawn of a Post-Literate Society (« La nouvelle ère obscure : la fin de la lecture et l’avènement d’une société post-lettrée », à paraître en septembre chez Bodley Head). La révolution des écrans constituerait un « tournant culturel majeur » qui signe la fin de toute une période de l’histoire occidentale marquée par l’imprimé. « La révolution numérique va transformer notre vie politique aussi profondément que l’a fait la révolution de la lecture au XVIIIe siècle », juge James Marriott.
Avant l’ouverture de la « parenthèse Gutenberg », le savoir et la mémoire étaient collectifs, collaboratifs, se transmettaient de bouche-à-oreille, par la famille, les amis, les voyageurs, les crieurs publics, évoluant au fil du temps. Pour le linguiste Walter Ong (1912-2003), disciple de McLuhan connu pour son ouvrage Oralité et écriture (1982 ; Les Belles Lettres, 2014), les sociétés orales se caractérisent par le rôle central que jouent la mémoire, la performance et l’interaction sociale dans la construction du savoir. »
🖥️ Best Local LLMs for Consumer GPUs — llama.cpp Guide (June 2026)
What I actually run on consumer hardware right now. Every model below runs via llama.cpp with a simple one-liner — no Docker, no Python env, no cloud.
━━━ 8-16GB VRAM ━━━
🔹 Gemma 4-12B (Google)
• Smartest model in this size class — competes with stuff 2× bigger
• Unsloth's MTP GGUFs: 162 tok/s vs 52 tok/s normal (3× speedup)
• Minimum 8GB VRAM recommended for Q4_K_M quant
• GGUF → https://t.co/VWp818MB3D
🔹 LFM2.5-8B-A1B (LiquidAI)
• Hybrid MoE, only 1B active params — absurdly fast for its size
• Perfect for 8-12GB cards, MacBooks, or anyone on a tight budget
• GGUF → https://t.co/ZbOs4mXJDq
━━━ 16-32GB VRAM ━━━
🔹 Qwen3.6-27B (Qwen)
• Scored 1.00 on tool-efficiency benchmarks — best local agent available
• 40 deterministic tasks, 32k/128k context needle tests — all passed
• GGUF → https://t.co/n7K3sPvliE
• MTP version (faster) → https://t.co/gwdfnJTzcy
🔹 Qwopus3.6-27B-v2 (Jackrong)
• Best quantization of Qwen3.6-27B — topped 5 agent & coding benchmarks (1200 samples)
• If you're running Q4, this is the one to grab
• GGUF → https://t.co/tV1DFqXnOD
• MTP version → https://t.co/PMqz7V5ewv
🔹 Gemma 4-31B QAT (Google/Unsloth)
• QAT variant with MTP draft head: 76-125 tok/s (1.67× speedup)
• Excellent for multi-agent / subagent workflows
• GGUF → https://t.co/FgVsUX0YOB
🔹 Nex-N2-Mini (Nex AGI)
• Post-train of Qwen3.5-35B-A3B — MoE with only 3B active params
• Fits on 16GB+ VRAM, overflow loads from system RAM
• Adaptive thinking saves ~20% tokens with no quality loss
• For deep multi-step reasoning, nothing in this size comes close
• GGUF → https://t.co/oyC522a8Eh
━━━ Quick Picks ━━━
• 16GB all-rounder → Gemma 4-12B with MTP GGUFs
• 32GB all-rounder → Qwen3.6-27B / Qwopus-v2
• Agents & tool use → Qwen3.6-27B or Qwopus Q4
• Deep reasoning → Nex-N2-Mini (MoE, fits 16GB+)
• Tight budget → LFM2.5-8B-A1B
• Cheapest full build: 1× used RTX 3090 (24GB) + rest of PC ≈ $1000-1500
━━━ Setup on Windows ━━━
1. Download llama.cpp → https://t.co/et0J7Swua7 (latest .zip)
2. Extract to any folder (e.g. C:\llama.cpp)
3. Download a .gguf from the links above (Q4_K_M or Q5_K_M for best quality/speed balance)
4. Run one of the commands below depending on your hardware
━━━ Launch Commands ━━━
SINGLE GPU — Standard model (no MTP):
llama-server.exe ^
-m C:\models\Qwen3.6-27B-Q5_K_M.gguf ^
--ctx-size 180000 ^
--flash-attn on ^
--cache-type-k q4_0 ^
--cache-type-v q4_0 ^
--batch-size 1024 --ubatch-size 512 ^
-ngl 100 ^
-np 1 ^
--port 8080 ^
--jinja
SINGLE GPU — MTP model (faster inference):
llama-server.exe ^
-m C:\models\Qwen3.6-27B-MTP-Q5_K_M.gguf ^
--ctx-size 180000 ^
--flash-attn on ^
--cache-type-k q4_0 ^
--cache-type-v q4_0 ^
--batch-size 1024 --ubatch-size 512 ^
--spec-type draft-mtp ^
--spec-draft-n-max 3 ^
-ngl 100 ^
-np 1 ^
--port 8080 ^
--jinja
DUAL GPU — Split across two cards:
llama-server.exe ^
-m C:\models\Qwen3.6-27B-Q5_K_M.gguf ^
--ctx-size 180000 ^
--flash-attn on ^
--cache-type-k q4_0 ^
--cache-type-v q4_0 ^
--batch-size 1024 --ubatch-size 512 ^
-ngl 100 ^
--tensor-split 0.55,0.45 ^
--main-gpu 0 ^
-np 1 ^
--port 8080 ^
--jinja
DUAL GPU + MTP + Vision (multimodal):
llama-server.exe ^
-m C:\models\Qwen3.6-27B-MTP-Q5_K_M.gguf ^
--ctx-size 180000 ^
--flash-attn on ^
--cache-type-k q4_0 ^
--cache-type-v q4_0 ^
--batch-size 1024 --ubatch-size 512 ^
--spec-type draft-mtp ^
--spec-draft-n-max 3 ^
-ngl 100 ^
--tensor-split 0.60,0.40 ^
--main-gpu 0 ^
-np 1 ^
--port 8080 ^
--jinja ^
--mmproj C:\models\mmproj-F16.gguf
━━━ Parameter Breakdown ━━━
-m <path>
Path to your .gguf model file. Change this to wherever you downloaded it.
--ctx-size 180000
Context window in tokens. 180k = huge context for long conversations or big codebases.
Reduce to 32768 or 65536 if you don't need long context — uses less VRAM.
--flash-attn on
Flash Attention — dramatically speeds up inference and reduces VRAM usage.
Works on RTX 30xx/40xx/50xx. Always enable this.
--cache-type-k q4_0 / --cache-type-v q4_0
Quantizes the KV cache (key/value attention cache) to 4-bit.
This is what makes 180k context fit in VRAM. Without it, huge contexts eat all your memory.
Quality impact is minimal — this is a free performance win.
--batch-size 1024 / --ubatch-size 512
batch-size = how many tokens are processed in one forward pass (throughput).
ubatch-size = micro-batch actually sent to the GPU per step.
Higher = faster prompt processing but needs more VRAM.
If you run out of VRAM, lower these (e.g. 512/256).
-ngl 100
Number of layers to offload to GPU. 100 = all layers on GPU (full offload).
This is what you want if the model fits in your VRAM.
If it doesn't fit, reduce this (e.g. -ngl 40) — remaining layers run on CPU/RAM.
--tensor-split 0.55,0.45
How to split model layers across multiple GPUs. Values are ratios.
0.55,0.45 = GPU 0 gets 55% of layers, GPU 1 gets 45%.
Adjust based on your VRAM — give more to the card with more memory.
Example: 0.70,0.30 for a 24GB + 12GB setup.
Not needed for single GPU setups.
--main-gpu 0
Which GPU handles the batch computation (the "orchestrator").
Set to 0 (your primary GPU). The other GPU(s) handle their assigned layers.
Minor performance impact — usually just leave it at 0.
-np 1
Number of parallel slots (concurrent requests). 1 = one user at a time.
Increase to 2-4 if you want multiple clients connected simultaneously.
Each extra slot uses additional VRAM for its own KV cache.
--port 8080
Which port the server listens on. Change if port 8080 is busy.
--jinja
Enables Jinja2 template processing — required for proper chat formatting.
Most modern models expect this. Always include it.
--spec-type draft-mtp
Enables Multi-Token Prediction (MTP) speculative decoding.
Only works with MTP GGUF models (downloaded separately).
The model predicts multiple tokens at once and verifies them — big speed boost.
--spec-draft-n-max 3
How many tokens the MTP draft head proposes per step.
3 is a good default. Higher = potentially faster but more VRAM and may reduce quality.
--mmproj <path>
Path to the multimodal projector file (for vision models).
Enables image understanding — paste screenshots into the web chat.
Only needed if you want vision capabilities. Omit for text-only use.
━━━ Your Hardware → Your Command ━━━
Single GPU (8-24GB VRAM):
Use the "Single GPU" command. Change -m to your model path.
8GB card → Gemma 4-12B Q4 or LFM2.5-8B
12GB card → Gemma 4-12B Q5/Q6
16GB card → Gemma 4-31B QAT Q4 or Nex-N2-Mini
24GB card → Qwen3.6-27B Q4/Q5, Qwopus-v2, Gemma 4-31B QAT Q5/Q6
Dual GPU:
Use the "Dual GPU" command. Adjust --tensor-split based on your VRAM ratio.
24GB + 24GB → --tensor-split 0.50,0.50
24GB + 12GB → --tensor-split 0.70,0.30
24GB + 8GB → --tensor-split 0.75,0.25
Want speed? Use MTP versions of models with the "MTP" commands.
Want vision? Add --mmproj with the projector file from the model's HuggingFace repo.
5. Once running, you get:
• Web chat UI → http://localhost:8080
• OpenAI-compatible API → http://localhost:8080/v1
• Playground → http://localhost:8080/playground
━━━ Why /v1 API Is the Killer Feature ━━━
One local endpoint replaces your entire cloud API bill. The /v1 endpoint is drop-in OpenAI-spec compatible — every tool that speaks OpenAI just works. No custom code, no glue layer.
Works out of the box with:
• IDEs: Cursor, Continue, Windsurf, Cline, Roo Code
• CLI tools: aider, Open Interpreter, OpenCode
• Frameworks: LangChain, LlamaIndex, LiteLLM
• Any OpenAI SDK (Python, Node, Go, Rust)
Why this beats cloud APIs:
• 100% private — code never leaves your machine
• $0 per token — no rate limits, no quotas, no surprise bills
• Works fully offline
• Zero telemetry, no training on your data
• Swap models by dropping in a different .gguf — no app changes needed
• Run 32k–128k context windows without burning money
Good combos:
• Cursor + Qwopus-v2 → near-frontier quality, zero API cost
• Continue + Qwen3.6-27B → best local coding agent
• aider + Gemma 4-12B MTP → 162 tok/s, feels instant
• OpenCode + Nex-N2-Mini → deep reasoning on 16GB
Set any OpenAI-compatible client to your local endpoint:
set OPENAI_API_KEY=sk-dummy (any non-empty string works)
set OPENAI_BASE_URL=http://localhost:8080/v1
# every OpenAI-compatible tool now hits your local GPU
Shoutouts: @0xSero@rS_alonewolf@witcheer@UnslothAI@LottoLabs
"Advanced Calculus" (Department of Mathematics, Harvard University) is one of the most remarkable advanced mathematics texts I have come across.
The book develops vector spaces, differential calculus, differential equations, integration, differentiable manifolds, differential forms, potential theory, and classical mechanics within a unified mathematical framework.
What I particularly appreciate is the combination of mathematical rigour and geometric intuition. It serves as an excellent introduction to modern analysis and differential geometry.
Definitely worth saving to your bookmarks if you are interested in understanding the mathematical structures underlying advanced calculus.
https://t.co/ZbShWnOpWN
Die Pickelhaube sitzt!
Nach UN-Angaben sterben durch die US-Blockade immer mehr Kinder auf Cuba.
Eine kürzlich in The Lancet veröffentlichte Studie schätzt, dass die von den USA zwischen 1971 und 2021 verhängten Sanktionen zu – konservativ gerechnet – 38 Millionen Todesfällen geführt haben.
Kriege, Stellvertreterkriege, erfolgreiche und -lose Regime-Change-Operationen, Militär-Aktionen, die Unterstützung drittklassiger Diktatoren, Flächenbombardements, Besetzungen, die Finanzierung und Anleitung diverser Kopfabschneider und die damit verbundenen Fälle von Hunger, Vertreibung, Krankheit, wirtschaftlichem Zusammenbruch & sozialen Verwüstungen, sind hier noch nicht einmal enthalten.
Daher ist es kaum überraschend, dass dem Democracy Perception Index 2026 einige deprimierend vergnügliche Trends zu entnehmen sind:
Fast die gesamte Welt hält die Vereinigten Staaten für die größte Bedrohung der Welt. (inklusive der Befragten in den Vereinigten Staaten selbst, lol)
10 Länder gaben stattdessen Russland an (u.a. Deutschland, Frankreich, Polen, Norwegen, Schweden, Finnland, Ukraine), 7 Staaten in Westasien & Nordafrika nennen Israel, Israel nennt den Iran und Japan: China.
Die meisten Menschen auf der Welt lehnen jegliche US-Militärpräsenz in ihrem Land ab. Eine klare Unterstützung für US-Stützpunkte gab es nur in 4 von 97 Staaten: Israel, Puerto Rico, Südkorea und Polen. Und in der CDU-Parteizentrale, bei Kiesewetter & Co.
Stichwort Optimismus
Entwickelt sich Ihr Land in die richtige Richtung?
Die Nation mit dem größten Optimismus und der weitestgehenden Zufriedenheit mit der Regierungspolitik ist China, das übrigens von einem wachsenden Anteil der Weltbevölkerung mit positiven Konnotationen versehen wird.
Die einzigen Länder der westlichen Hemisphäre, in denen eine Mehrheit die Frage bejahte, sind El Salvador & Nicaragua (das von der Sandinistischen Front regiert wird).
Die pessimistischsten Zukunftseinschätzungen gab es in Nigeria (korrupt & kaputt), Puerto Rico (US-Kolonie, kaputt), Frankreich (verschuldet & kaputt), Deutschland (kaputt & verschuldet) und dem Libanon (verschuldet, kaputt, bombardiert, besetzt).
Gestern mal Zeitung gelesen?
„Pleitewelle in Ostdeutschland - vergleichbar mit Treuhand-Kahlschlag der 1990er“
„Aufträge der deutschen Industrie brechen doppelt so stark ein wie erwartet“
„DIW: Wachstumsprognose halbiert, strukturelle Probleme, Industrie nicht mehr wettbewerbsfähig “
„Schlimmer als jedacht“ Depression Quarterly
Der Direktor der französischen Elitekaderschmiede Science Po, Luis Vassy, hat Geschwindigkeit und Ausmaß des Niedergangs in Europa untersucht und berechnet, dass dieser rasanter verläuft als der Niedergang Chinas zum Höhepunkt des „Jahrhunderts der Demütigung“ Mitte des 19. Jahrhunderts. Damals dauerte es 50 Jahre, bis Chinas Anteil am Welt-BIP von 30% auf 17% geschrumpft war. Für dieselbe Schrumpfung brauchte die EU zwischen 2008 und 2025 nur 17 Jahre. Der Niedergang der EU verläuft drei Mal schneller als der der Qing-Dynastie.
Unsere notorische Selbstüberschätzung in der EU und unser Unvermögen zu begreifen, was außerhalb Europas vor sich geht, sind längst nicht mehr nur ein intellektuelles Versagen, sondern ein Existenzrisiko für uns geworden.
Und die 3 unbeliebtesten Regierungschefs der Welt aller Zeiten – und Frau vonderLeyen – machen Ihnen da draußen vor, dass man den selbstverschuldeten Niedergang mit Marschmusik und Pickelhauben aufhalten kann. Tätärää! Tschingbumm!
Releasing Walk on Spheres Extensions (WoSX): a GPU-accelerated C++/Python library for Monte Carlo physics simulation on complex geometry
Think path tracing but for physics beyond light transport: heat, electrostatics, potential flow, deformation & more!
https://t.co/1F59rys9tw
Crazy that this is getting barely any coverage. This year’s European Press Prize was just awarded to an investigative report by the Dutch newspaper De Volkskrant. It is entitled “What the Wounds Tell” and in it the journalists Maud Effting and Willem Feenstra document the cases of 114 children in Gaza under the age of 15 who were struck by a single bullet to the head or chest. Almost all of them died or were left severely disabled. They chose to document only the cases of boys and girls under the age of 15 (though often much younger: aged 3, 4 or 7) because these are children who can be immediately identified as such. “A single bullet in these parts of the body is a clear indication that these children were deliberately targeted“, the two journalists write.
This is the article: https://t.co/YkZrpqBWBQ
Heute ist ein guter Tag, um an diese Stellungnahme von >100 Wissenschaftler:innen des Völkerrechts und der internationalen Beziehungen von März 2026 zu erinnern:
https://t.co/ZvO2wOV3bQ
Tantura, le film sous-titré en français.
En 1948, quelques mois après la création d’Israël, des soldats juifs israéliens ont commis un massacre dans ce petit village côtier paisible. La brigade Alexandroni, une unité de l’organisation terroriste Haganah, attaque. Les soldats rassemblent les hommes, les femmes, les enfants. Ils violent des femmes. Ils exécutent. Au moins 250 morts, selon les témoins. Des enfants de 13 ans, une balle dans la nuque, sur la plage. À peine sortis de l’horreur nazie, certains ont reproduit les mêmes crimes sur des civils innocents. Plus tard, ils enterreront les corps dans des fosses communes pour cacher l’horreur.
Le chercheur israélien Teddy Katz documente les faits et recueille les aveux de soldats. L’un d’eux rigole : « Je ne me souviens pas du nombre d’Arabes que j’ai tués. » Un autre pleure, mais trop tard. Katz est traîné en justice, perd son diplôme et signe une rétractation qu’il regrettera amèrement. Les preuves, elles, ne se rétractent pas : les fosses communes sont toujours là. L’une d’elles, sous un parking, a été documentée par Forensic Architecture. Les vétérans avouent à la caméra, dans Tantura.
Ce n’est pas un mythe, pas une légende. C’est la Nakba. C’est Israël.
Dans ce film, on voit le déni dans lequel ils sont plongés. Ils n’admettront jamais avoir assassiné 250 personnes à Tantura. Alors, comment pourraient-ils reconnaître avoir tué des dizaines de milliers d’enfants à Gaza ? Le déni les suit depuis toujours. C’est leur armure. Et leur malédiction.
Le film est sous-titré en français. Regardez. Et n’oubliez pas.
WOW
A website is DOCUMENTING Israel’s crimes with GEOLOCATION, dates, categories of crimes, and footage of the incidents themselves.
One click and you can see EXACTLY what Israel did.
An enormous digital archive built for ACCOUNTABILITY.
Link: https://t.co/TWKgXJ41NC
Direct Link: https://t.co/qWkrhx1FT7
my gut reaction to ai in math is i'm excited about getting access to an infinitely patient teacher that's near expert in every area of math.
this is possibly the best time in history to be doing math as a hobby.
Test-time scaling for Tiny Recursive Models (TRM) without retraining or task-specific augmentation. Just K parallel rollouts with noise in the latent, the existing Q head selects among them
Boosts pretrained TRM by up to 51 points on hard puzzles!
https://t.co/5XJbsqM31q
🧵1/N
After probably 100 hours I can finally say I am coming to a stop.
Shout out to @Replit . This started for their 10 year anniversary buildathon and I haven't stopped since. Long days, sometimes 16 hour days at the weekend.
I'm at a stage where I can finally sign off.
KinetiCAD is browser-native parametric CAD. Real B-rep geometry kernel, OpenCascade compiled to WebAssembly. Live rigid-body physics with Rapier. Sketch, extrude, revolve, fillet, chamfer, boolean operations. Five mate types, motorised joints. An eight-material library with density-driven mass. STEP import, export and round-trip. WebGPU rendering. No install, no licence, no CAD seat.
Verified by maths, not vibes:
A motorised windmill assembly tuned to hold exactly pi radians per second. Across 420 simulation steps it held between 3.1415925 and 3.1415930. Target pi is 3.1415927. Every sample within 1.5e-7.
Material mass is real arithmetic, not an estimate. A 5.70 cm³ part: steel at 7.87 g/cm³ gives 0.045 kg, brass at 8.50 gives 0.048 kg, PLA at 1.25 gives 0.007 kg. Exact, every time.
If the maths is wrong, it is not a CAD tool. So the maths gets checked.
FREE to use and open source. MIT licensed.
I will always try something, even if I fail, because that's my mindset.
https://t.co/KBHrubvcvR
@ThreeJS #CAD #BuildInPublic #AdeviousAI