Sind zur Sicherung des "Hormuz-Friedens" jetzt eigentlich blaue Kanister vorgesehen? Blaue Helme sind bei dieser Sorte "Frieden" ja nicht erforderlich.
@dichterjurist Ja. Diese ganzheitliche & hautnahe Erfahrung ist dem Sofa irgendwie trotzdem vorzuziehen - wenn man es hinter sich hat und langsam wieder trocknet.
Bei mir hat es mit dem Sonnenschein am Schlechtwettertag an der Elbe nicht ganz so gut funktioniert, wie bei @dichterjurist (klitschnass gepostet).
https://t.co/sVTgfM8q5H
Das Drama der Migranten muss zu einer Gewissensprüfung werden: für die Herkunftsländer, die Bedingungen für Frieden, Gerechtigkeit und Entwicklung schaffen müssen; für die Transitländer, die dazu aufgerufen sind, die Schwachen zu schützen und sie nicht in die Hände krimineller Netzwerke zu überlassen; für Europa, das nicht die Menschenwürde proklamieren kann und sich dabei nicht daran gewöhnen darf, dass das Mittelmeer und der Atlantik zu Friedhöfen ohne Grabsteine werden; für die internationale Gemeinschaft, die zu einer wirksamen und beharrlichen Zusammenarbeit aufgerufen ist. https://t.co/I5xEiWmudQ
Ein berechtigter Einwand, Thomas, den nehme ich an. Die Modellgewichte lernen im normalen Betrieb nicht live aus Endnutzerfeedback, und ein ungefilterter Feedback-Loop auf Serving-Ebene wäre schon wegen Data-Poisoning praktisch nicht haltbar.
Und Claudes Sycophancy hat mich hier tatsächlich beim ersten heißen Kaffee kalt überlistet: Claudes Begründung ist nicht belastbar. Was ich auf der Beobachtungsebene stehen lassen würde: Über Produkt-, Alignment- und Trainingsprozesse sowie über nicht-parametrische Komponenten wie Systemprompts, Routing, Memory oder Retrieval verschiebt sich das sichtbare Verhalten eines KI-Produkts über die Zeit durchaus – tendenziell in Richtung gefälliger, sicherer, gleichförmiger. Das ist dann aber, wie Du sagst, ein Entwicklereingriff in Etappen, kein autonomes Angleichen an die Masse im laufenden Betrieb.
(Sorry für zweimaliges Löschen und Neuposten dieses Kommentars, ich hatte hartnäckige Tippfehler im Text.)
@ConstSchreiber Ein sehr informatives Video! Wenn man einmal in Israel war, versteht man den Israelhass erst recht nicht mehr. Israel wird von vielen instrumentalisiert, die das Land und seinen kulturellen Reichtum nicht kennen.
Guten Morgen Thomas, nach einem Kaffee und mit der Formulierungshilfe von Claude präzisiere ich meine Aussage.
Ursprünglich hatte ich das hier gemeint:
Auch nach dem Launch wird ein KI-Modell oft schmaler in seinen Antworten – nicht weil die Entwickler etwas ändern, sondern weil das System auf Basis von Nutzerfeedback bevorzugt bestimmte Antworten auswählt: Varianten, die vielen Nutzern gefallen, werden häufiger ausgespielt; ungewöhnliche oder kantige Antworten verschwinden nach und nach. Das Ergebnis: Die Antworten wirken mit der Zeit gleichförmiger und „durchschnittlicher“, obwohl das Modell selbst gar nicht neu trainiert wurde.
Fachkontext
- Mechanismus: Feedbackgesteuerte Auswahl auf Serving-Ebene – Reranking, Routing/Policy-Auswahl zwischen Kandidatenantworten, Caching häufiger Antworten sowie automatisierte Prompt- und Parameter-Anpassungen auf Basis aggregierter Nutzersignale (Thumbs, Regenerate-Raten, Session-Länge).
- Effekt: Verschiebung der ausgelieferten Antwortverteilung Richtung Modi mit hoher durchschnittlicher Akzeptanz; Entropieverlust und Diversitätsabnahme, ohne dass Modellgewichte aktualisiert werden.
- Verstärker: Typicality-, Length- und Sycophancy-Bias im aggregierten Feedback plus Feedback-Loop (bevorzugte Antworten werden häufiger gezeigt → erhalten mehr positives Feedback → weiter bevorzugt).
- Abgrenzung: Kein Mode Collapse im strengen Sinn auf Modellebene, sondern Verengung der *sichtbaren* Verteilung auf Serving-Ebene; analog zu Filterblaseneffekten in Recommender-Systemen. Online-DPO/KTO oder periodisches Fine-Tuning wären eine zusätzliche Verstärkung, setzen aber aktive Re-Training-Pipelines voraus und gehören damit nicht zum Effekt „ohne Einwirkung der Entwickler“.
@ScherhagThomas Mir ist das regelmäßig aufgefallen in der ersten Zeit nach einem Release, es ist aber tatsächlich wahrscheinlicher, dass das zum Release geschehen ist. Das würde dann deine Aussage stützen.