The narrative around AI and coding is so bonkers and contradictory. It's going to replace programmers. It's a tool for senior devs and no one will hire junior devs anymore. It lets junior devs work with the productivity of senior devs. Productivity gains of 95% or -30%.
A BEST CASE SCENARIO FOR AI?
The Doomer narratives were wrong. Predicated on a “rapid take-off” to AGI, they predicted that the leading AI model would use its intelligence to self-improve, leaving others in the dust, and quickly achieving a godlike superintelligence. Instead, we are seeing the opposite:
— the leading models are clustering around similar performance benchmarks;
— model companies continue to leapfrog each other with their latest versions (which shouldn’t be possible if one achieves rapid take-off);
— models are developing areas of competitive advantage, becoming increasingly specialized in personality, modes, coding and math as opposed to one model becoming all-knowing.
None of this is to gainsay the progress. We are seeing strong improvement in quality, usability, and price/performance across the top model companies. This is the stuff of great engineering and should be celebrated. It’s just not the stuff of apocalyptic pronouncements. Oppenheimer has left the building.
The AI race is highly dynamic so this could change. But right now the current situation is Goldilocks:
— We have 5 major American companies vigorously competing on frontier models. This brings out the best in everyone and helps America win the AI race. As @BalajiS has written: “We have many models from many factions that have all converged on similar capabilities, rather than a huge lead between the best model and the rest. So we should expect a balance of power between various human/AI fusions rather than a single dominant AGI that will turn us all into paperclips/pillars of salt.”
— So far, we have avoided a monopolistic outcome that vests all power and control in a single entity. In my view, the most likely dystopian outcome with AI is a marriage of corporate and state power similar to what we saw exposed in the Twitter Files, where “Trust & Safety” gets weaponized into government censorship and control. At least when you have multiple strong private sector players, that gets harder. By contrast, winner-take-all dynamics are more likely to produce Orwellian outcomes.
— There is likely to be a major role for open source. These models excel at providing 80-90% of the capability at 10-20% of the cost. This tradeoff will be highly attractive to customers who value customization, control, and cost over frontier capabilities. China has gone all-in on open source, so it would be good to see more American companies competing in this area, as OpenAI just did. (Meta also deserves credit.)
— There is likely to be a division of labor between generalized foundation models and specific verticalized applications. Instead of a single superintelligence capturing all the value, we are likely to see numerous agentic applications solving “last mile” problems. This is great news for the startup ecosystem.
— There is also an increasingly clear division of labor between humans and AI. Despite all the wondrous progress, AI models are still at zero in terms of setting their own objective function. Models need context, they must be heavily prompted, the output must be verified, and this process must be repeated iteratively to achieve meaningful business value. This is why Balaji has said that AI is not end-to-end but middle-to-middle. This means that apocalyptic predictions of job loss are as overhyped as AGI itself. Instead, the truism that “you’re not going to lose your job to AI but to someone who uses AI better than you” is holding up well.
In summary, the latest releases of AI models show that model capabilities are more decentralized than many predicted. While there is no guarantee that this continues — there is always the potential for the market to accrete to a small number of players once the investment super-cycle ends — the current state of vigorous competition is healthy. It propels innovation forward, helps America win the AI race, and avoids centralized control. This is good news — that the Doomers did not expect.
A little bit more of humanity is in space today. 🇺🇸🇮🇳🇵🇱🇭🇺
The four-member crew of #Ax4 includes astronauts from @ESA and @ISRO. @Axiom_Space's fourth private astronaut mission is set to arrive at the @Space_Station on Thursday, June 26: https://t.co/fnGkb4d64E
Celowe awaryjne zatrzymania pociągów, podejrzenia o modyfikacje oprogramowania i potencjalne zagrożenie dla bezpieczeństwa państwa to główne wątki w sprawie działania systemów sterowania w pociągach firmy Newag.
🧵 Tego tematu dotyczą moje interpelacje, które dziś skierowałam do czterech resortów. Zapraszam na wątek ze szczegółami ⤵️
🛑Ministerstwo Cyfryzacji chce, by prezes Urzędu Komunikacji Elektronicznej wydawał nakazy blokowania treści w internecie
🛑Decyzje te mają być stosowane bez udziału sądu
🛑Przepis dodano już po konsultacjach publicznych
🛑UKE będzie podejmować decyzje o blokowaniu treści w krótkim czasie (od 2 do 21 dni). Kim? 🙅♀️
🛑Decyzja będzie można zaskarżyć do sądu administracyjnego
🛑Osoby publikujące treści dowiedzą się o ich usunięciu dopiero po fakcie
Więcej Elżbieta Rutkowska @jabrzoza w @DGPrawna. Link do tekstu poniżej 👇
Wielbicieli fajerwerków oraz innych materiałów pirotechnicznych pragniemy poinformować, że cena naszych usług jest niezależna od ilości brakujących kończyn lub procenta oparzeń ciała.
Na dodatek wszystkie paluszki musicie sami wyzbierać. 😘
Co tu się dzieje? Poseł PiS Andrzej Adamczyk mówi w kontekście grupy Dragon sector, która ujawniła machinacje przy pociągach Newagu, o złodziejach i napadzie na dom. Potem posłowie PiS i PO nie chcą słuchać co ustalił Dragon sector i głosują za przerwaniem posiedzenia komisji. To po co ta komisja?
cc: @PolaMatysiak@Zaufana3Strona@niebezpiecznik@Sekurak
@JacekPlaPlacek@boleslawbreczko@Cyfronet Słusznie! To pewnie dlatego USA, Chiny i Niemcy "ściagają" się na doktoraty, bo tylko wtedy można projektować i produkować konkurencyjne produkty.
@annawitten@Przegaa Technologia nas nie zawiodła w czasie powodzi, bo w Polsce nie ma sytemów do zarządzania kryzysowego z prawdziwego zdarzenia. Podobnie jak nie ma centralnego systemu ostrzegania ludności.
@WojtekKardys Jak to możliwe, że nie wykorzystuje się rozwiązań klasy RTS/RTOS (Real Time Operating System) w infrastrukturze krytycznej? Takie rozwiązania jak systemy lotniskowe powinno się projektować i budować systemy inaczej.
@WojtekKardys Problem jest trochę innego kalibru. Nasza współczesna cywilizacja jest uzależniona od prawidłowego działania ŹLE ZAPROJEKTOWANYCH systemów informatycznych. Infrastruktura krytyczna powinna działać na systemach innej klasy.
🚨 CYBERALERT 🚨 Polacy masowo otrzymują SMS-y informujące o wpisie do rejestru długów. Co ciekawe, SMS-y zawierają poprawne imię i nazwisko.
⚠️ Jeśli ktoś pobierze zalinkowany raport, to zostanie mu naliczona opłata w wysokości 1299zł.
Kim jest nadawca SMS-ów i skąd ma dane? Co robić, jeśli kliknęło się link pobrania raportu? O tym piszemy w alercie: https://t.co/kpQNFJd16b
PS. Chcesz otrzymywać takie ostrzeżenia jako pierwszy? Pobierz naszą całkowicie darmową aplikację CyberAlerty na Androida lub iPhona. Apka wyśle Ci ostrzeżenie jeśli wykryjemy w polskim internecie coś, co może zagrażać Twojemu bezpieczeństwu, prywatności lub oszczędnościom. Apkę pobierzesz stąd: https://t.co/VFpyqVHm8l
⚠️ Ostrzeżcie znajomych! Są już dziesiątki osób, które dostały wezwanie do zapłaty. Pls RT!
Now that we have about two dozen LLMs in the market, here are the dimensions that matter when it comes to using them.
Reasoning - Claude 3 Opus beats everything out
Code - GPT-4 is still king here
Cost - Claude Haiku is your best bet
Latency - Claude or a local open-source model is worse best
Fine-Tuning - If you must fine-tune, I would vote for Mistral.
Best Local Model - If your security team throws a fit for no good reason and insists on a local model - Qwen 72B or Smaug-2 (fine-tune on Qwen). Qwen 72B instruct is on top of the human eval leaderboard.
Best small local model - Starling-7b. Again, on top of that leaderboard.
I purposely didn't include the extended context here as it has yet to translate to good context understanding. For now, I prefer sticking to 128K and dealing with it.