Wir sind dann mal DOWN.
Aus a) gesundheitlichen, b) finanziellen, c) technologischen d) sonstigen Gründen mussten die Server kurzfristig abgestellt werden.
Die Probleme mit den semantischen Netzen innerhalb von Text-Dokumenten hatten wir 2018/19 auch bemerkt. Grund: Texte haben in Einzelteile zerlegt eine sehr geringe Spezifität, selbst wenn sie verschiedenen Domains angehören. Zerlegung führt nicht zum Sinn.
RAG is broken and nobody's talking about it.
Stanford researchers exposed the fatal flaw killing every "AI that reads your docs" product in existence.
It’s called "Semantic Collapse," and it happens the second your knowledge base hits critical mass. If you've noticed your AI getting "dumber" as you add more data, this is exactly why.
Right now, companies are dumping thousands of documents into their AI, thinking it’s getting smarter.
When you add a document to RAG, it converts it into a high-dimensional vector.
Under 10,000 documents, this works perfectly. Similar concepts cluster together.
But past 10,000 documents, the space fills up. The clusters overlap. The distances compress.
Everything starts to look "relevant."
It is a mathematical law called the Curse of Dimensionality. In a 1000-dimensional space, 99.9% of your data lives on the outer edge. All points become equidistant from each other.
That perfect, relevant document you are looking for now has the exact same mathematical similarity as 50 completely irrelevant ones.
The Stanford findings are brutal:
At 50,000 documents, precision drops by 87%. Semantic search actually becomes worse than old-school keyword search.
Adding more context doesn’t fix the AI. It makes the hallucinations worse.
Your "nearest neighbor" search isn't finding the best answer anymore. It's finding everyone.
We thought RAG solved hallucinations.
It didn't. It just hid them behind math.
@H_v_Vielen@StWolle67@felix_bohr Und? Ändert alles nichts daran, dass der agitatorische Patriotismus immer wieder katastrophale Geschwüre hervorgebracht hat und Heine bereits in der Phase der europäischen Nationalisierung den emotionalen Nonsense als den geistigen Kern der Nationalbewegungen in Europa erkannte.
... zuweilen über Jahren gesammelten Input ziemlich spektakulär. Seit Evernote von Bending Spoons übernommen wurde, gehen dort die Sprints enorm ab.
Empfehlung, sich Evernote wieder anzuschauen - auch als Schreibplattform von längeren Texten.
Erinnert sich noch jemand an TEXTL de? Höchtsvermutlich nicht. Als wir 2013 mit der semantischen Suche begannen, war die Zielidee genau das, was sich jetzt bei @Evernote findet. Kurz ausprobiert - es ist für Schreibende aller Zünfte mit großen Mengen von diversem, ...
@gespraechswert@SebTillmann@SZ Ja, es sind Methoden gescheitert. Das Ziel, in wachem Zustand mit aufgeschlagenen Augen zu kommunizieren, auch zu handeln und zu helfen, ist dadurch nicht infragegestellt Alles wie immer: Blöde Vereinfachungen und verschlossenes Denken funktionieren nicht gut.
@OliverBWeber @akruska ... das heitere Leben auf Insta, wo der/die-jenige den größten Erfolg hat, der das heitere Leben am professionellsten in Bilder umsetzt. So jetzt auch im Ministerium: ernsthaft daran arbeiten, heiter und locker zu erscheinen.
@OliverBWeber @akruska Die gute alte "Unlust an der Kultur", weil für die Kultur Affekte beherrscht werden müssen. Da es nun um Social Media geht, will man keinesfalls Unlust bereiten.
Die Flucht in den Witz gelingt aber nicht: Dieses Vergnügtsein ist ungeheuer ernst. (Besonders "ernst" scheint mir...
@schuetz_marcel Interessanterweise glaubt er nicht, etwas mit Kampagnen-Clips reißen zu können. Was die erwähnte Unfähigkeit zum strategischen Vorgehen belegen würde. (Wurde er nicht 2016 zum Kandidaten als Zugpferd-Tool der GOP gemacht, also für die Strategie anderer?)
@schuetz_marcel Es gibt da noch die Medien und ihre Not mit den Quoten. Die lauern auf die Fälle, die sie für ihre Unfallberichtserstattung brauchen. Sodass ich mich frage, ob "Unfall" nicht einfach besagt: Einfluss von Medien und Massen-Social-Media, also Medienwirkung ("Glotze und BILD").
Der unglaublichste Beweis wäre, wenn eine Handschrift, die man selbst nicht zu entziffern vermag, von der Maschine korrekt entziffert wird ... in 1 Sekunde.
New open source OCR model just dropped! This one by Microsoft features the best text recognition I've seen in any open model and performs admirably on handwriting.
It also handles a diverse range of vision tasks. You can play with it here: https://t.co/gCLes81Th3
Probably Twitter can't raise citations of a boring or not very interesting paper so that you have to write 1) a good article in the first place, 2) channels more related to your peers might be more effective than Twitter.
"Today I want to look at whether Twitter serves as a novel kind of knowledge diffusion platform ..."
Some figures suggest the thesis: "receiving any tweets about your research is associated with about 16% more citations." But various other research do not ...
Alignment weg, dafür Chef der NSA (bis vorigem Jahr) jetzt bei OpenAI an Bord. Der übliche "mafiöse" Schachzug der Plattformen: Man schützt sich gegenseitig. Bringt sich gegenseitig Vorteile. Und schweigt. OpenAI ist jetzt (auch) ein Staatsprojekt.
OpenAI added retired U.S. Army General and former NSA head Paul M. Nakasone to its Board of Directors
Nakasone previously led the NSA from 2018 to 2023 and will help improve AI's role in cybersecurity and protect OpenAI from bad actors https://t.co/GoeRY49WDv
@martinlindner Viel zu undialektisch. Wie ist Israel in die Gewalt-Ecke gedriftet? Den versteinerten Unfrieden verantworten andere. Wer lässt keine Demokratie zu, keinen Rechtsstaat, keine andere Politik als Vernichtungskampf, beutet seine eigenen Leute aus?
@schuetz_marcel Ja, die Rachelust ("reaktive Aggression") ist bis jetzt nicht vollständig gezähmt. Befeuert immer wieder zu Ausbrüchen von Gewalt. Andere Aggression als kontrollierten Schutz sollte es in zivilen Gesellschaften nicht mehr geben ... dauert noch ein paar Generationen.
Imam Ramazan Demir & @RabbiHofmeister sind die Preisträger & Vorbilder, die diese herausfordernde Zeit braucht. Sie zeigen, dass man das Eigene nicht aufgeben muss, um dem Anderen zugewandt zu bleiben, dass Empathie keine begrenzte Ressource & Menschenwürde universal ist.
"amplifying the 'Golden Gate Bridge' feature gave Claude an identity crisis even Hitchcock couldn’t have imagined: ... 'I am the Golden Gate Bridge… my physical form is the iconic bridge itself…'"
Interessantes Research: https://t.co/gbIP6O8Dfh