I built "zero2claude", a free course that takes people from zero terminal experience to shipping with Claude Code.
The curriculum goes from absolute zero → software basics → Claude Code fundamentals → advanced usage. No shortcuts, no assumptions.
17,000+ students. 7 languages. ~500 active hourly.
No marketing. No ads. Pure word of mouth.
The entire platform? Built and operated by one person
with Claude Code.
Lighthouse audit:
✅ Performance : 96
✅ Accessibility : 100
✅ Best Practices : 100
✅ SEO : 100
Production stats:
~6.4M requests/day. 74 req/sec sustained. <0.003% error rate.
Claude Code doesn't just write code. It builds production-grade, scalable products.
The best way to grow Claude Code adoption isn't to simplify the tool. It's to level up the people. Give fishing rods, not fish.
Free. No paywall. My contribution to the community.
Link in the comments 👇
Introducing the new Gemini powered Docs, Sheets, Slides, and Drive experience featuring AI Overviews, fulled editable AI made slides, and new grounding sources to make writing docs context aware 📃
Available today to G1 Pro and Ultra users : )
I've never felt this much behind as a programmer. The profession is being dramatically refactored as the bits contributed by the programmer are increasingly sparse and between. I have a sense that I could be 10X more powerful if I just properly string together what has become available over the last ~year and a failure to claim the boost feels decidedly like skill issue. There's a new programmable layer of abstraction to master (in addition to the usual layers below) involving agents, subagents, their prompts, contexts, memory, modes, permissions, tools, plugins, skills, hooks, MCP, LSP, slash commands, workflows, IDE integrations, and a need to build an all-encompassing mental model for strengths and pitfalls of fundamentally stochastic, fallible, unintelligible and changing entities suddenly intermingled with what used to be good old fashioned engineering. Clearly some powerful alien tool was handed around except it comes with no manual and everyone has to figure out how to hold it and operate it, while the resulting magnitude 9 earthquake is rocking the profession. Roll up your sleeves to not fall behind.
Gemini Nano Banana Pro can solve exam questions *in* the exam page image. With doodles, diagrams, all that.
ChatGPT thinks these solutions are all correct except Se_2P_2 should be "diselenium diphosphide" and a spelling mistake (should be "thiocyanic acid" not "thoicyanic")
:O
Announcing my new course: Agentic AI!
Building AI agents is one of the most in-demand skills in the job market. This course, available now at https://t.co/zGHUh1loPO, teaches you how.
You'll learn to implement four key agentic design patterns:
- Reflection, in which an agent examines its own output and figures out how to improve it
- Tool use, in which an LLM-driven application decides which functions to call to carry out web search, access calendars, send email, write code, etc.
- Planning, where you'll use an LLM to decide how to break down a task into sub-tasks for execution, and
- Multi-agent collaboration, in which you build multiple specialized agents — much like how a company might hire multiple employees — to perform a complex task
You'll also learn to take a complex application and systematically decompose it into a sequence of tasks to implement using these design patterns.
But here's what I think is the most important part of this course: Having worked with many teams on AI agents, I've found that the single biggest predictor of whether someone executes well is their ability to drive a disciplined process for evals and error analysis. In this course, you'll learn how to do this, so you can efficiently home in on which components to improve in a complex agentic workflow. Instead of guessing what to work on, you'll let evals data guide you. This will put you significantly ahead of the game compared to the vast majority of teams building agents.
Together, we'll build a deep research agent that searches, synthesizes, and reports, using all of these agentic design patterns and best practices.
This self-paced course is taught in a vendor neutral way, using raw Python - without hiding details in a framework. You'll see how each step works, and learn the core concepts that you can then implement using any popular agentic AI framework, or using no framework. The only prerequisite is familiarity with Python, though knowing a bit about LLMs helps.
Come join me, and let's build some agentic AI systems!
Sign up to get started: https://t.co/FX35dloqw4
Wielkie porównanie modeli DeepResearch – rozbudowana analiza
Porównałem GPT o3-pro, Gemini 2.5 Pro, GPT-4 (wersja darmowa), Perplexity, Claude 3 Opus, Grok 3 oraz Kimi.
Analiza przeprowadziłem pod kątem generowania specjalistycznych raportów na tematy związane z energetyką, co pozwoliło na ocenę ich zdolności do pracy z danymi naukowymi, technicznymi, ale też prawnymi i ekonomicznymi.
Szczegółowy Ranking i Analiza Modeli
1. GPT o3-pro
Model bezkonkurencyjny pod względem kompletności, jakości i wiarygodności raportu.
GPT o3-pro, najnowsza iteracja od OpenAI, wykazuje się cechami kluczowymi dla zastosowań profesjonalnych:
- Kompletność i precyzja danych
Model dostarcza najbardziej wyczerpujące raporty. Każde zdanie jest nasycone konkretną informacją, a co najważniejsze, jest natychmiast weryfikowalne dzięki klikalnym przypisom w generowanym pliku PDF. To absolutnie kluczowa funkcja, która odróżnia go od konkurencji i buduje zaufanie do prezentowanych danych.
- Kondensacja wiedzy
Mimo ogromnej ilości informacji, raporty są zwięzłe. Model unika typowych dla AI "lania wody", długich wstępów czy ogólnikowych stwierdzeń. Przechodzi od razu do sedna, co jest niezwykle cenne w analizach biznesowych i technicznych.
- Samodzielność analityczna
Zdolność do autonomicznego tworzenia rozbudowanych tabel porównawczych z trafnie dobranymi kryteriami świadczy o zaawansowanym rozumieniu tematu. Model nie tylko agreguje dane, ale również je syntetyzuje i prezentuje w przystępnej, ustrukturyzowanej formie.
- Czytelność i przejrzystość
Stosowanie wyróżnień (pogrubień) kluczowych terminów i wartości znacząco poprawia czytelność i pozwala na szybkie skanowanie dokumentu w poszukiwaniu najważniejszych informacji.
GPT o3-pro to narzędzie klasy "premium", idealne do tworzenia audytów, raportów strategicznych i dogłębnych analiz rynkowych w sektorze energetycznym.
2. Gemini 2.5 Pro
Najlepsze uzupełnienie dla GPT o3-pro, z naciskiem na aspekty prawne i ekonomiczne - jest to bardzo cenna informacja, widać że model, w dużym stopniu był trenowany na danych prawnych i ekonomicznych, i mimo że prompt był taki sam, Gemini poświęciło znacznie więcej miejsca na takie dane
- Podejście tematyczne
Zamiast odpowiadać punkt po punkcie, Gemini samodzielnie grupuje zagadnienia w klastry tematyczne. W ramach tych grup omawia podane pojęcia, co prowadzi do bardziej holistycznego i kontekstowego zrozumienia tematu.
Głębia prawno-ekonomiczna
Model ten wyróżnia się wyjątkowo silnym naciskiem na analizę otoczenia regulacyjnego i biznesowego. Jego raporty są nasycone informacjami o dyrektywach, ustawach, modelach finansowania i barierach rynkowych, co czyni go narzędziem szczególnie istotnym dla analityków biznesowych i prawników.
- Źródła i bibliografia
Choć źródła w tekście nie są klikalne (co jest minusem w porównaniu do GPT o3-pro), model nadrabia to, dołączając na końcu kompletną, dobrze sformatowaną bibliografię. Pozwala to na późniejszą weryfikację, choć wymaga dodatkowej pracy.
- Tabele porównawcze
Generuje szerokie i merytoryczne tabele, choć jest ich mniej niż u lidera. Skupiają się one głównie na aspektach ekonomicznych i technicznych.
Gemini 2.5 Pro jest idealnym narzędziem do analiz strategicznych, due diligence oraz oceny ryzyka regulacyjnego w projektach energetycznych.
3. GPT-4 (free)
Najlepszy wybór w kategorii darmowej, oferujący wysoką jakość w stosunku do braku kosztów.
Darmowa wersja GPT-4 udowadnia, że zaawansowane analizy nie zawsze muszą być drogie. Jej charakterystyka jest bardzo zbliżona do płatnego odpowiednika, co czyni ją niezwykle atrakcyjną opcją:
Jakość "light" wersji pro
Raport jest o około połowę krótszy niż ten z GPT o3-pro, ale zachowuje jego kluczowe zalety: klikalne odnośniki w tekście, pogrubione słowa-klucze i logiczną strukturę. Styl i układ są niemal identyczne, co ułatwia pracę.
- Treściwość
Mimo mniejszej objętości, raport wciąż zawiera dużo konkretnych danych i unika pustych frazesów.
- Analiza
Analiza jest nieco płytsza i mniej szczegółowa niż w wersjach "Pro", ale nadal stoi na wysokim poziomie i w większości przypadków wyczerpuje kluczowe zagadnienia, co jest imponujące jak na darmowe narzędzie.
GPT-4 w wersji darmowej to nadal świetny research. Myślę że w większości przypadków będzie wystarczający.
4. Perplexity
Skupia się na danych liczbowych do szybkiego researchu, choć z ograniczoną głębią analityczną.
Nasycenie danymi
Raporty są krótsze, ale ekstremalnie gęste od danych liczbowych, statystyk i parametrów technicznych. Model generuje też dużą liczbę małych, konkretnych tabel porównawczych.
Problem ze źródłami w PDF
Brak działających linków w pliku PDF i brak końcowej bibliografii to poważny mankament. Aby dotrzeć do źródeł, trzeba korzystać z wersji online raportu, co utrudnia archiwizację i pracę z dokumentem.
Płytka analiza
Model świetnie agreguje dane, ale jego własna analiza jest ograniczona. Często raport jest po prostu zbiorem liczb i faktów, co może przytłaczać i utrudniać wyciąganie wniosków.
Perplexity jest idealny do szybkiego wyszukiwania konkretnych danych liczbowych, parametrów i statystyk. Mniej nadaje się do tworzenia kompleksowych raportów analitycznych.
5. Claude 3 max Opus
Specjalista od "case studies", ale z brakami w analizie porównawczej.
- Nacisk na studia przypadków
Model kładzie nieoczekiwanie duży nacisk na analizę konkretnych projektów, wdrożeń i technologii w praktyce. Zamiast suchych danych, woli opisywać realne przykłady.
- Brak tabel porównawczych
Brak tabel utrudnia szybkie zestawienie i porównanie danych, zmuszając do czytania całych akapitów tekstu.
- Czytelność
Podobnie jak modele GPT, stosuje klikalne odnośniki i pogrubienia, jednak ich dobór bywa czasem losowy i nie zawsze podkreśla najważniejsze informacje.
- Pobieżna analiza
Analiza jest często ograniczona do wniosków z prezentowanych studiów przypadku, brakuje szerszego, strategicznego spojrzenia.
Claude 3 Opus jest cennym narzędziem do poszukiwania inspiracji, przykładów wdrożeń i zrozumienia praktycznych aspektów technologii energetycznych. Gorzej radzi sobie z analizą rynkową opartą na twardych danych.
6. Grok 3 (free)
Przejrzystość i zwięzłość kosztem głębi i szczegółowości.
Grok 3 od xAI, zgodnie ze swoją filozofią, stawia na bezpośredniość
Minimalizm treści
Raport jest najkrótszy, ale jednocześnie bardzo przejrzysty. Składa się głównie z wypunktowań i niewielkich tabel, co ułatwia szybkie przyswojenie informacji.
Problem z powiązaniem źródeł
Model prezentuje na końcu ogólną listę wykorzystanych stron internetowych, bez przypisania ich do konkretnych danych. To duży minus z punktu widzenia weryfikowalności.
Powierzchowna analiza
Analiza jest bardzo ogólna i stanowi raczej podsumowanie zebranych punktów, niż dogłębną refleksję.
Grok 3 może być użyteczny do tworzenia szybkich notatek, prezentacji lub jako punkt wyjścia do dalszego, bardziej szczegółowego researchu.
7. Kimi(free)
Duża objętość, ale niska wartość merytoryczna i problemy techniczne.
- Brak konkretów
Raport jest obszerny, ale treść jest rozwodniona. Brakuje w nim twardych danych i konkretnych informacji, które można znaleźć u konkurencji.
- Błędy językowe i formatowanie
Problemy z polskimi znakami diakrytycznymi, pojawiające się chińskie znaki oraz nadmierne pogrubianie całych zdań sprawiają, że tekst jest nieprofesjonalny i trudny w odbiorze.
Sam z siebie, do raportu dorzuca jeszcze prezentacje która jest często bardziej treściwa i zawiera linki, w przeciwieństwie do raportu PDF. To sugeruje, że potencjał modelu nie jest w pełni wykorzystywany w standardowym trybie generowania tekstu.
- Mało rzeczowa analiza
Mimo dużej objętości, analiza jest powierzchowna i nie wnosi wartości dodanej.
Na obecnym etapie Kimi nie jest narzędziem godnym polecenia do profesjonalnych analiz w języku polskim. Jego rozwój warto jednak obserwować.
potentially very helpful. will increase stickiness of chatgpt as compared to other llms out there. but, it will also freak some people out and for a good reason, too.
Starting today, memory in ChatGPT can now reference all of your past chats to provide more personalized responses, drawing on your preferences and interests to make it even more helpful for writing, getting advice, learning, and beyond.
This morning I watched our three beautiful, talented, creative kids build a fort out of couch cushions, dance for 35 minutes straight to the Curious George song, laugh until they cried about who could color the fastest, and make up a song about a bunny.
It's crazy to think that one day 20 years from now, if everything goes perfectly for them, they'll be able to harness this passion for life into Associate Project Manager roles at Salesforce.
Just to flesh out other narratives flying around. Both the USA and Europe have around given the same amount of military aid to #Ukraine...
(source: @kielinstitute Ukraine Support Tracker)
I started Thinking Machines Lab alongside a remarkable team of scientists, engineers, and builders. We're building three things:
- Helping people adapt AI systems to work for their specific needs
- Developing strong foundations to build more capable AI systems
- Fostering a culture of open science that helps the whole field understand and improve these systems
Our goal is simple, advance AI by making it broadly useful and understandable through solid foundations, open science, and practical applications.
https://t.co/y2Bbl6BKF9