@K_Stanowski Stirlitz szedł ulicami Berlina, coś jednak zdradzało w nim szpiega: może czapka-uszanka, może walonki, a może ciągnący się za nim spadochron?
@WojtekKardys Nie nazwałbym "falą krytyki" dowolną ilość komentarzy od anonimów w internecie.
Średnio rozgarnięty stażysta z ambicjami politycznymi zorganizuje parę kont socialowych i wygeneruje sporo komentarzy potwierdzających tezę, że pojawił się "spontaniczny" hejt.
@MarcinBanas3@piotrekszydelko@Money_pl Jest korzystny dla instytucji i osób, które korzystają z redystrybucji długu. Czyli system bankowy, administracja, politycy, biznes korzystający z wydatków publicznych.
Jest niekorzystny dla produktywnej części społeczeństwa. Tych co pracują i oszczędzają.
Pozwolę sobie na pewną prognozę: w ciągu maksymalnie dwóch lat chińskie, otwartoźródłowe modele LLM dorównają jakością zamkniętym modelom rozwijanym w USA! Niedawna premiera DeepSeek V4 wyznacza ostateczne przejście chińskich wielkoskalowych modeli na w pełni własny stos technologiczny. Teraz nie mają już przed sobą żadnych barier, by skalować trenowanie modeli na taką skalę, na jaką tylko zechcą.
Nie chcę wchodzić w szczegóły poszczególnych benchmarków – faktem jest, że do tej pory chińskie modele open source zostawały w nich w tyle o około 4-6 miesięcy. To jednak wkrótce się zmieni, ponieważ głównym ograniczeniem był dla nich sprzęt. Swoisty „moment DeepSeek” obserwowaliśmy już rok temu, kiedy firma musiała wykazać się absolutnym geniuszem technologicznym, by wytrenować model na tym, czym akurat dysponowała – czyli na zaledwie 2048 okrojonych chipach NVIDIA H800. Teraz wszystko wskazuje na to, że trenowanie mniejszego modelu DeepSeek-V4 Flash przeprowadzono na układach Huawei Ascend, podczas gdy wnioskowanie (inference) zarówno dla mniejszego, jak i większego modelu zostało zoptymalizowane pod chińskie procesory.
Co więcej, aby to wszystko mogło zadziałać, DeepSeek odszedł od zdominowanego przez Nvidię ekosystemu CUDA i całkowicie przebudował swój stos do trenowania oraz wnioskowania. Został on stworzony tak, by był natywny dla architektury Huawei CANN (Compute Architecture for Neural Networks) oraz środowiska MindSpore (lub zoptymalizowanego pod układy Ascend PyTorcha).
To wszystko dzieje się dokładnie w tym samym czasie, gdy:
- Chiny wyprzedzają USA w całkowitych wydatkach na R&D – co dobrze widać na poniższym wykresie.
- Cała 22-osobowa, niezależna rada National Science Foundation (NSF) zostaje zwolniona mailem przez prezydenta USA – na zaledwie kilka dni przed ukończeniem prac nad raportem o stanie amerykańskiej nauki.
- Wydatki na R&D w Unii Europejskiej utknęły w martwym punkcie, nie planuje się żadnych wielkich, przełomowych kroków, a nawet unijne konkursy na "gigafabryki" łapią kolejne opóźnienia.
Tymczasem w Polsce pozytywną zmianą było powołanie Instytutu Badawczego IDEAS, jednak my:
- nie zwiększyliśmy wydatków na badania i rozwój – w ubiegłym roku spadły one po raz pierwszy od bardzo długiego czasu,
- nie stworzyliśmy Uniwersytetu AI, który mógłby stać się magnesem przyciągającym globalne talenty,
- nie zainwestowaliśmy w wielkoskalową infrastrukturę obliczeniową.
Nasz instytut to świetny początek, ale apetyt rośnie w miarę jedzienia i dziś potrzebne są kolejne, zdecydowane działania. To wszystko rodzi również niezwykle ważne, geopolityczne pytanie: którą drogą i którym podejściem do rozwoju R&D powinniśmy podążać?
Palantir - CEO Alex Karp opublikował 22 punktowy manifest i zastanawiam się, czy ta liczba tylko przypadkowo jest zbieżna z 22 punktami, które dwa tygodnie temu opublikował Mistral - CEO Arthur Mensch. Obydwie listy mimo, że zawierają tyle samo punktów to pokazują, że AI w USA i w Europie to dwa odmienne sposoby myślenia i dwa różne światy!
Czytanie ich jeden po drugim to jak oglądanie na zmianę „Gwiezdnych Wojen” i instruktażu wypełniania unijnego formularza VAT. W przypadku Palantira to jednak należy się zastanowić, czy to manifest rebeliantów, czy może imperium? Ale nie chcę wnikać w politykę.
Wizja USA (Palantir): Geopolityka i broń
- Pkt 4: Miękka siła to za mało - w tym stuleciu twarda siła będzie zbudowana na oprogramowaniu.
- Pkt 5: Musimy budować broń AI, bo nasi wrogowie nie będą czekać na debaty o etyce.
- Pkt 12: Kończy się era atomowa, zaczyna się era odstraszania oparta na sztucznej inteligencji.
Wizja Europy (Mistral): Błagamy, naprawcie urzędy, bo chcemy pracować!
- Pkt 6 & 7: Prosimy, stwórzcie jeden portal, żebyśmy nie musieli wypełniać tych samych papierów do GDPR, AI Act i Data Act.
- Pkt 8 & 9: Czy możemy mieć automatyczne uznawanie aktów korporacyjnych w UE, żeby CEO nie musiał fizycznie jeździć po Europie z papierami do notariuszy?.
- Pkt 1: Bardzo prosimy o "AI Blue Card", czyli szybką wizę, żeby inżynierowie mogli u nas legalnie pracować w 15 dni.
Gdy Amerykanie debatują o tym, że sztuczna inteligencja zdefiniuje układ sił na planecie na kolejne stulecie, a programiści powinni czuć patriotyczny obowiązek obrony kraju... my w Europie walczymy o to, by móc założyć konto bankowe dla firmy w innym państwie członkowskim bez fizycznej obecności.
To jest równie zabawne, co przerażające.
Z jednej strony Mistral ma 100% racji. Z ich whitepapera przebija ból startupu, który próbuje urosnąć na rynku podzielonym na 27 różnych reżimów prawnych. Ich postulaty - jak europejski fundusz na doktoraty z AI , programy mobilności naukowców czy ułatwienia w dostępie do infrastruktury obliczeniowej dla MŚP - są nam potrzebne na wczoraj, jeśli chcemy zatrzymać talenty.
Z drugiej strony - Palantir pokazuje, w jakiej lidze grają USA. Tam nikt nie przeprasza za to, że chce dominować, ani nie prosi o ułatwienia formalnoprawne.
Jako osoba budująca od lat pomosty między nauką a biznesem w europejskim ekosystemie powiem tak: wdrożmy te 22 punkty Mistrala jak najszybciej, żebyśmy w ogóle mogli wyjść na boisko i przestać potykać się o własne sznurówki. Ale jeśli jako Europa nie zaczniemy myśleć o technologii w kategoriach amerykańskiego punktu 4 (AI to fundament przetrwania demokratycznych społeczeństw), to obudzimy się jako bardzo dobrze uregulowany, ale całkowicie uzależniony od innych skansen.
Manifest Mistrala jest tutaj: https://t.co/IDsCvLR79T, a Palantira pochodzi z X: https://t.co/DLfNarhlbW.
Nie po to studiowałem informatykę, aby teraz rozmawiać z ludźmi - usłyszałem kiedyś od jednego z pracowników. Jest teraz bardzo dużo dyskusji o przyszłości zawodu programisty, bo niby staną się niepotrzebni, bo nie wystarczy samo kodzenie, ale też trzeba mieć soft-skille. No bo przecież teraz nie trzeba kodzić, bo jest "vibe coding", ale jak pokazuje załączony wykres zaczyna trendować "vibe coding is dead".
Dobrej odpowiedzi co się dzieje daje artykuł "Prompts Are Programs Too! Understanding How Developers Build Software Containing Prompts" (https://t.co/Piwfj5hI6x), zawiera on wniosek, że promptowanie to po prostu inny sposób programowania. Zespół zidentyfikował 14 kluczowych obserwacji udowadniających, że instruowanie AI współdzieli fundamentalne cechy z klasyczną inżynierią oprogramowania. Aby skutecznie wytłumaczyć AI, co ma napisać, musimy przeprowadzić proces obejmujący specyfikowanie wymagań oraz projektowanie. Badania te pokazują, że do "vibe codingu" też trzeba umieć programować:
- Koniec mitu łatwości: Albo wytłumaczymy LLMowi dobrze co ma zaprogramować, albo otrzymujemy nieczytelny i nieefektywny kod, z błędami architektury, czy lukami bezpieczeństwa. Potem czeka nas debugowanie i naprawianie długu technicznego.
- Prompty to też kod: Definiowanie promptów wymaga jednak pewnej formalności i zrozumienia zależności komponentów, czy definicji wejścia-wyjścia. Specyfikacja nie może być niejednoznaczna.
- Krytyczna przewaga myślenia komputacyjnego: Porażki nowicjuszy w promptowaniu nie wynikają z braku zdolności językowych, ale z braku odpowiednich modeli mentalnych działania programu. Brak im zdolności do logicznej dekompozycji zadań, czy iteracyjnego diagnozowania błędów.
- Język techniczny: Profesjonalny słownik inżynieryjny pozwala natychmiast zawęzić zakres wymagań dla AI. Ograniczenie wieloznaczności działa tu podobnie do ochrony typu i testowania wyjątków w czystym kodzie. To umiejętność, którą nabywa się głównie poprzez budowanie klasycznego oprogramowania.
Wszystkie te przesłanki znajdują potwierdzenie w badaniach produktywności. Warto spojrzeć na pracę (https://t.co/y2krXgN83Q), w której przebadano ponad 30 milionów commitów na GitHubie od 170 000 deweloperów. Szacuje one, że AI pisze dziś około 29% funkcji w języku Python w USA, co podniosło kwartalną produktywność (mierzoną wkładem w kod) o 3.6%. Generatywne AI ułatwia też programistom wchodzenie w zupełnie nowe domeny technologiczne. Ale najważniejszy wniosek z tej publikacji brzmi następująco: te zyski dotyczą tylko doświadczonych programistów. Współpraca z SI zamiast zasypywać lukę kompetencyjną, pogłębia ją, premiując tych, którzy posiadają silne, inżynieryjne fundamenty.
Wniosek z tego moim zdaniem jest taki, że jak na razie warto umieć kodzić nawet jak zamierza się vibe codować, a wieszczony przez wielkich tego świata zmierzch programistów jeszcze nie nadchodzi. Tu odwołuję się do niedawnych wypowiedzi Jensena Huanga, czy Dario Amodei.
@ELITA_NA_JDG Coś jednak zbudował. Najtańsze sposób wynoszenia satelit, starlink, jedyna realna konkurencja dla chińskich EV, skuteczne implanty neural link, X nadal działa i nie blokuje lewaków. Dałoby radę obdzielić życiorysy paru osób.
@SlawomirDebski@MajewskiMichal Stirlitz szedł ulicami Berlina, coś jednak zdradzało w nim szpiega: może czapka-uszatka, może przypięty do piersi rosyjski order, a może ciągnący się za nim spadochron?