@MichaelButtonX Early humans were spread thinly across continents, and they were always migrating. Bands of 20-50 people are not likely to create any useful history
Except for tool use, there's hardly any difference between early Homo sapiens in small nomadic bands and modern chimpanzee troops
Brukte Whisper Large til å generere undertekstane etter at lyden var ferdiggenerert. Ikkje heilt nøyaktig, fordi TTS-modellen framleis skiftar over til dansk innimellom.
Eg testar den norske TTS-modellen min på nytt. Eg prøvde å halde emnet interessant og relevant.
Mange går ut frå at dei arbeidarane som vert utskifte av KI, berre kan omskolere seg, skifte yrke eller finne nye høve i ein voksande økonomi. Men kva om det ikkje finst nok stader å flytte til? Kva om fagyrka ikkje kan suge opp millionar av fortrengde kunnskapsarbeidarar? Kva om dei politiske løfta om omfordeling viser seg å vera langt vanskelegare å setje ut i livet enn teknologioptimistane trur?
Denne teksten tek for seg nokre av dei mest folkeslege argumenta i KI-debatten og granskar kvifor dei kanskje ikkje held. Gjennom økonomiske grunngjevingar og konkrete forteljingar om menneske som allereie har opplevd karrierekollaps, argumenterer ho for at utfordringa ikkje berre gjeld teknologien, men politikk, institusjonar og samfunnet si evne til å handtere snøgge strukturelle omskifte.
Just used Ideogram 4 to create this 80s-style movie poster.
The "magic prompt" LLM feature is extremely powerful... turns simple one-line prompts into exactly what Ideogram needs to create those perfect images.
For a 1280x1280px image, it takes about 5 minutes on an L4 GPU.
Typography and graphic design remain the strongest capabilities of 4.0, like you'd expect from Ideogram models.
Logos, posters, multi-font layouts, long-form text, and creative typography that's actually integrated into the design.
Still not fast enough. Yet to see companies that have only CEOs and CTOs, and no other employees that use computers.
We are still not in the "one human + AI swarm" era. Zero non-exec computer users... that's the holy grail
Batterikostnadene har falle eksponentielt, om lag 20 % eller meir for kvar dobling av produksjonsvolum, likt det ein ser for solkraft. Dei tidlege elbilane (t.d. GM EV1 på 1990-talet eller den fyrste Tesla Roadster) var dyre og meir som eksperimentelle prosjekt. Seinare, kring 2010-talet, betra rekkjevidd og pris seg raskt, noko som førte til brei marknadsinnføring og press på dei tradisjonelle bilfabrikantane, som måtte tilpassa seg raskt.
Dette speglar S-kurva for bilindustrien sjølv på byrjinga av 1900-talet: ei langsam byrjing der hestar vart utkonkurrerte, og deretter ei brå og fullstendig omvelting.
Introducing Cosmos 3: Our latest frontier model for Physical AI
Cosmos 3 is the world’s first fully open omnimodel with native vision reasoning, world and action generation.
Today we’re releasing Super (32B) and Nano (8B) variants.
Finst det nokon opne kjeldemodellar for videogenerering som duger til å skriva tekst? Eg prøvde både LTX og Wan, og båe mislukkast. Dei skriv visst noko, men ikkje den teksten eg vil ha dei til. Gemini Omni synest derimot å vera svært dugande til dette...
@fofrAI That's impressive. fwiw, Ernie Image can generate an image with that repetitive text. For the page flipping, need to pass it as an initial image to either Wan 2.2 or LTX-2.3... and see how they perform. Will share if I get any passable results
@Polymarket Reminds me of Bane... and how he and his League of Shadows crew turned Gotham's underground tunnels and sewers into their operational base.
@fofrAI My attempt using Wan 2.2 with a depth map for control again. I would really like to see something that's truly impossible with existing open models
@fofrAI My attempt using Wan 2.2 with a depth map for control again. I would really like to see something that's truly impossible with existing open models
So, I had to try re-creating this using open models... the models I chose were Wan 2.2 Animate and Z-Image Base. Used a depthmap to control the video. It's possible, but it takes more effort
So, I had to try re-creating this using open models... the models I chose were Wan 2.2 Animate and Z-Image Base. Used a depthmap to control the video. It's possible, but it takes more effort