PhD/Research Director, Digitalisation and Tech Policy @ Swedish Entrepreneurship Forum. Assistant Professor in Technology and Society @ Lund University.
@RikardN@neo_andreas@SvDledare@roksschnittger@SvD Plattformarna är vad som kallas flersidiga plattformsekonomier, både annonsörer och användare är kunder. Annonsörerna subventionerar i praktiken användares kostnader, men båda är kunder t plattformen. Se exv https://t.co/gxKTOldFhD för popvet översikt.
@RikardN@neo_andreas@SvDledare@roksschnittger@SvD Jag tror man måste vara väldigt explicit i vad man reglerar för att uppnå vad och hur. Om ngt är entydigt dåligt kan man få en sådan signal (jmfr om säkerhetsbälte o tobak i avsnittet), men ”sociala medier” uppfyller inte de kraven om tydlighet vilket påverkar mottagande också
@RikardN@SvDledare@neo_andreas@roksschnittger@SvD Jag menar att om problmet är att barn (under 16 el 13) är på dessa plattformar så är det redan idag utfall av att man ljuger när man skapar användarkontot. Glappet mellan beteende och regelverk innebär att man normaliserat ljugandet, något som kan bli värre.
Sverige riskerar att fastna i en jobbförstörelsefälla, men inte för att AI tar alla jobb utan för att befintliga institutioner och politik hindrar framväxten av nya jobb. Om detta skriver jag och @drbergh på DN Debatt: https://t.co/8SASOO6ZzW
Today, we're releasing ARC-AGI-2. It's an AI benchmark designed to measure general fluid intelligence, not memorized skills – a set of never-seen-before tasks that humans find easy, but current AI struggles with.
It keeps the same format as ARC-AGI-1, while significantly increasing the signal strength it provides about a system's actual fluid intelligence. Expect more novelty, less redundancy, and deeper levels of concept recombination. There's a lot more focus on probing abilities that are still missing from frontier reasoning systems, like on-the-fly symbol interpretation, multi-step compositional reasoning, and context-dependent rules.
ARC-AGI-2 is fully human-calibrated. We tested these tasks with 400 people in live sessions, and we only kept tasks that could reliably be solved by multiple people. Each eval set (public, private, semi-private) has the exact same human difficulty – average people in our test sample achieve 60% with no prior training, and a panel of 10 people achieve 100%.
Alltid värt att lyssna på @drbergh och @jolun. Det senaste avsnittet extra så. Håller med i rekommendation att politiker bör sluta sola sig i glansen från riskfyllda startups.
https://t.co/HHwwXBDq4A
Finns det en övergripande ideologi i Silicon Valley och är den i så fall mer libertariansk eller teknokratisk? Och vad spelar det för roll för debatter om teknikens samhällspåverkan? Det diskuterar jag och @drbergh i senaste avsnittet av #berghwernberg. https://t.co/pHcGg1w9bo
Nämen, ett nytt avsnitt av Ideologipodden är ute! Med flera av författarna som skrivit i antologin "Kontinuitet och förändring: Essäer om spårbundenhet i samhället". @hallonsten@JohanssonHeino@IsakssonPar@jolun
Matnyttig och rolig överblick av forskningen om maskiner, människor och jobb, signerad SoeTechs och Ratios nya doktorand @georgiossideras ! Ser mycket fram emot att arbeta ihop kring dessa frågor!
Kom till lunchsamtal hos oss den 27 februari! @hallonsten och Anna Persson, redaktörer av antologin "Kontinuitet & förändring: essäer om spårbundenhet i samhället" kommer prata med två andra som också skrivit i boken: @jolun och Elisabeth Lindberg
https://t.co/BK3XuveiyG
Är Sverige hopplöst efter i AI-omställningen? Och är industripolitik mer OK om det handlar om AI? I senaste Bergh & Wernberg (med @drbergh ) diskuterar vi AI-kommissionens slutrapport och jag förklarar varför jag menar att svaret på båda frågorna är nej. https://t.co/0prLM8alxD
Hur går det när de duktiga ska avslöja att de coola har fel? I nya #berghwernberg pratar vi om Henrik Jönsson, Ny demokrati och amerikanska presidenter - med mera. Lyssna här: https://t.co/iZIt1W514a
I senaste avsnittet av Bergh och Wernberg pratar jag och @drbergh om varför coola debattörer med känslobaserade argument som har lite rätt återkommande klyver samhällsdebatten:
https://t.co/wULCPuAsHJ
We verified the o3 results for OpenAI on @arcprize
My first thought when I saw the prompt they used to claim their score was...
"That's it?"
It was refreshing (impressive) to see the prompt be so simple
"Find the common rule that maps an input grid to an output grid"
For those who didn't get it -- AlphaGo was a MCTS search process that made thousands of calls to two separate convnets in order to compute a single game move.
Something like o1 pro is also, best we can tell, a search process making thousands of calls to multiple LLMs to output a single answer.
Hence the 1:1 analogy here.
Deep learning did hit that wall, and the natural answer to get past it was deep learning plus search. AI research is about to enter its deep-learning guided program synthesis (or CoT synthesis) arc.
While OpenAI’s o3 ARC/AGI test scores certainly are impressive, I strongly recommend reading @fchollet ’s thread about how this relates to AGI, bottle necks and future expectations on AI:
Today OpenAI announced o3, its next-gen reasoning model. We've worked with OpenAI to test it on ARC-AGI, and we believe it represents a significant breakthrough in getting AI to adapt to novel tasks.
It scores 75.7% on the semi-private eval in low-compute mode (for $20 per task in compute ) and 87.5% in high-compute mode (thousands of $ per task). It's very expensive, but it's not just brute -- these capabilities are new territory and they demand serious scientific attention.
Today OpenAI announced o3, its next-gen reasoning model. We've worked with OpenAI to test it on ARC-AGI, and we believe it represents a significant breakthrough in getting AI to adapt to novel tasks.
It scores 75.7% on the semi-private eval in low-compute mode (for $20 per task in compute ) and 87.5% in high-compute mode (thousands of $ per task). It's very expensive, but it's not just brute -- these capabilities are new territory and they demand serious scientific attention.
Samtalar med @MathiasSundin från AI-kommissionen om deras slutrapport, förslagen de kommer med samt förhållandet mellan stora planer och marknadskrafter vid teknikskiften, allt under ledning av @neo_andreas i @SvDledare :s podd: https://t.co/IFFkjuBgN8