Ayer.
El padre de mi amiga, 80 años, vasco en Palencia, cae y se abre la cabeza.
Traumatismo craneoencefálico, hemorragia y traslado urgente en ambulancia al hospital provincial.
—¿Qué medicación toma?
—No estoy segura, ¿no puede mirarlo usted en su historia clínica?
—No; no tenemos acceso.
Literal.
Yo sé que hay un proyecto del SNS para compartir la historia clínica entre los servicios autonómicos de salud. He leído memorias e informes sobre eso. He utilizado el servicio HCDSNS. Pero, ¿en el hospital de Palencia no pueden consultar la historia de un paciente de Bilbao?
El hombre, inconsciente, postrado en una camilla, y el médico no puede acceder a su historia clínica. ¡Qué puñetera vergüenza de país!
Le hacen pruebas y analíticas. Días después, mi amiga gestiona un transporte urgente en ambulancia hasta Bilbao.
Pero necesita llevar a Osakidetza los resultados de las pruebas médicas —varios TAC, analíticas…— que hicieron a su padre en Palencia.
Dicen que no lo pueden enviar por correo electrónico.
Dicen que no se lo pueden guardar en un pendrive.
Al final le guardan los resultados… ¡en un puñetero CD-ROM!
Llega ayer mi amiga agotada y angustiada a mi casa —en Santander—, desde Palencia, pidiéndome leer el CD-ROM del Servicio de Salud de Castilla y León (SACYL) para enviarlo por email al médico del Servicio Vasco de Salud (Osakidetza) y después salir corriendo otra vez en coche hacia Bilbao.
De verdad, ¡idos todos a la mierda!
La privacidad ya no es derecho. Es un lujo que dura hasta que te ponen la mira encima. Eso no es modernización. Es más poder del Estado sobre ti.
La Agencia Tributaria compró en 2023 500 licencias de Cellebrite Pathfinder (software israelí distribuido por Syvalue) por 325.000-326.000 euros.Solo se usa en expedientes ya abiertos y con autorización judicial para incautar móviles, ordenadores o datos en la nube.
Pero una vez dentro, entra a fondo: analiza chats, correos, fotos, vídeos, contactos, localizaciones y patrones. Con IA, Deep Learning y Procesamiento de Lenguaje Natural (PLN) interpreta jergas, contextos semánticos, une puntos automáticamente y genera conexiones. Un móvil medio tiene decenas de miles de fotos y mensajes. La máquina lo procesa todo en minutos.
Aunque sea "solo" para investigados, esto cambia el juego. Tu dispositivo deja de ser privado. La IA no revisa solo facturas: mapea tu círculo social, familiar y profesional, infiere intenciones, detecta incoherencias entre tu tren de vida y lo declarado.
Como advierte el profesor Bernardo Olivares (UCM, Fiscalblog): "¿Quién dirige realmente la inspección, el funcionario o la máquina que le abre el camino?"
El software ya no busca coincidencias ortográficas: interpreta con abstracción casi humana y construye el relato de la prueba. ¿Eficiencia contra el fraude? De momento, el precio es alto: tu intimidad se convierte en dato forense en cuanto te señalan. Hoy es para delitos fiscales. Mañana, para lo que el Estado quiera ampliar.
La herramienta ya está pagada, instalada y operativa.
Hacienda ya no te pide papeles. Te abre la cabeza digital y deja que una IA israelí te lea mejor que tú.
Texto por: @mundo_viperino
Fuente del artículo: https://t.co/EiXlGNdRqO
Hacienda retuvo 60 millones de euros de Shakira durante 8 años sin poder demostrar nunca que vivía en España.
163 días en territorio español. La ley exige 183. Veinte días de diferencia que le costaron una década de vida.
Y lo más brutal: la Audiencia Nacional no solo le da la razón — la condena en costas a la AEAT. Eso casi no ocurre nunca. Se aplica solo cuando hay "temeridad y absoluta falta de fundamento".
Piénsalo: mientras tú y yo pagamos religiosamente, el sistema puede retenerte el capital de trabajo de una gira mundial entera, destruirte la reputación públicamente... y si al final pierden, simplemente devuelven el dinero con intereses.
Lo que me parece más revelador no es el caso de Shakira. Es lo que dice su abogado: "Este modus operandi asfixia a muchos contribuyentes anónimos que no disponen de los recursos para defenderse."
Ella pudo. La mayoría no puede.
¿Cuántos expedientes como este habrá ahí fuera con ciudadanos sin nombre que no tienen ni el dinero ni la energía para llegar hasta el final?
Deja tu opinión abajo — me interesa saber qué piensas de esto.
Lo que estos tipos acaban de soltar en GitHub no tiene ningún sentido.
Un Palantir open source. Se llama OSIRIS.
Rastreo en tiempo real:
• vuelos comerciales, privados y militares
• satélites y la ISS
• cámaras públicas de calle
• terremotos, incendios y clima severo
• instalaciones nucleares y zonas de conflicto
Recon integrado, sin instalar nada:
• escaneo de puertos
• DNS y WHOIS
• certificados SSL
• reputación de IP
Todo sobre un globo 3D, en el navegador, gratis.
Más de 1.500 estrellas en diez días.
El software de inteligencia acaba de perder su aura sagrada.
⭕️ HAGAN ZOOM, PAGAN USTEDES…
Es brutal lo de Zapatero sí, pero sepan que mientras hablamos de ello, el pasado martes el Gobierno repartió la friolera de casi 20.000 millones de € (veinte mil, han leído bien)
Lean aquí: https://t.co/JS22s5bplD
🇪🇸 A threat actor is advertising an alleged dataset tied to Spain’s Agencia Tributaria electronic platform — the country’s official tax administration portal.
According to the listing, the exposed records allegedly include:
• full names
• DNI/NIE/CIF national identity identifiers
• birth dates
• residential information
• multiple phone numbers
• country/province data
• taxpayer-related metadata
• technical indicators/flags
And if authentic, this is exactly the kind of dataset cybercriminals love most:
high-confidence identity infrastructure.
Why?
Because government-linked identity datasets dramatically increase the effectiveness of:
• financial fraud
• tax scams
• identity theft
• synthetic identity creation
• banking impersonation
• social engineering
• telecom fraud
• SIM swapping
• account recovery abuse
One especially important point:
DNI/NIE identifiers are foundational identity attributes in Spain.
When attackers combine:
• national IDs
• phone numbers
• birth dates
• residence information
they can often build highly convincing fraud profiles.
And modern cybercrime is increasingly about:
identity correlation.
Not just “stealing passwords.”
Another major concern:
tax-related data carries unusually high trust value.
People panic when they receive:
• tax notices
• audit warnings
• refund alerts
• “missing payment” messages
Attackers know this extremely well.
So datasets like these can become fuel for:
• phishing campaigns impersonating tax authorities
• fake refund operations
• identity verification fraud
• malicious e-signature requests
• banking takeover attempts tied to tax filings
And yes…
some phishing emails now have better branding consistency than government portals themselves.
The listing also references:
• electronic certificates
• digital signatures
• taxpayer verification systems
which is particularly notable because trust ecosystems around digital identity infrastructure are now prime targets globally.
Governments increasingly rely on:
• centralized citizen identity systems
• e-government platforms
• electronic signatures
• digital tax workflows
which means compromise impact scales rapidly.
Another trend worth watching:
large citizen identity datasets are becoming strategic underground assets.
They are reused repeatedly across:
• fraud marketplaces
• credential stuffing ecosystems
• KYC bypass operations
• crypto onboarding fraud
• mule recruitment
• financial identity laundering
because verified identity data is now effectively a commodity.
At this stage, the authenticity and scope remain unverified.
However, organizations operating national-scale digital identity infrastructure should continuously monitor for:
• credential exposure
• unauthorized API access
• abnormal taxpayer queries
• identity enumeration activity
• phishing campaigns abusing government branding
• suspicious document verification requests
• e-signature abuse attempts
• underground marketplace activity targeting citizen records
Because once identity infrastructure data enters criminal ecosystems, the downstream effects can persist for years.
🇪🇸 #DDW #Intelligence #CyberSecurity #DarkWeb #Spain #DataLeak #ThreatIntelligence #IdentityTheft #Infosec #Fraud
👋 ¡Hola, ministro @oscarlopeztwit!
Estará usted ya harto de mí. 😃
Y yo del software que desarrolla su ministerio, así que… ¡empate! 🙃
Le explico la yincana de hoy:
Para facturar al sector público proporcionan ustedes un servicio de generación de facturas electrónicas: ✨MiFacturae✨.
Lo primero que quiero decirle y agradecerle es que MiFacturae ha mejorado muchísimo. Pero, sin pretender un demérito, también le digo que empeorarlo era imposible.
El nuevo MiFacturae solo tiene ahora un problema: ¡no funciona!
Se lo explico:
Para facturar a un organismo público hay que identificarlo con —que yo sepa— cuatro datos:
1️⃣ Oficina contable
2️⃣ Órgano gestor
3️⃣ Unidad tramitadora
4️⃣ Órgano proponente
Pues bien: MiFacturae omite de la factura electrónica este último dato, el órgano proponente. De modo que al remitir la factura al FACe, falla y es rechazada.
Esto seguramente esté robando miles de horas productivas mensuales a ciudadanos, empresas y organismos públicos.
Si desarrollaran su software en abierto yo podría reportar esto directamente al equipo de desarrollo, como ya hice en abril con dos problemas serios en Autofirma.
Pero como no lo hacen, le tengo que molestar a usted. O a su responsable de comunicación, que será —con suerte— el que quizá lea esto. Porque yo como ciudadano no tengo otro camino para canalizarle la frustración ciudadana con la Administración Electrónica estatal.
…Y pedir a mis pacientes seguidores, si son tan amables, que redifundan esto, pues es la única esperanza de que llegue a alguien en su ministerio —o en la AEAD o donde diablos sea— con capacidad de mover un dedo para resolverlo.
Saludos cordiales,
— Jaime
✨ xAI publicó ayer el algoritmo de X y no entiendo cómo nadie se ha dado cuenta de lo que realmente tiene en sus tripas
Me he fundido 500 pavos en Claude analizando hasta la última línea
Esto es lo que he descubierto (POST LARGO, guárdatelo para luego):
0/ Cada cuenta tiene un "embedding" asociado que te describe como lo hacen los modelos de IA: en el espacio latente. Es la huella digital interna que el modelo guarda de cada usuario, un vector de números que resume cómo se comporta tu cuenta (qué temas tocas, qué engagement generas, con quién interactúas). El modelo lo usa cada vez que decide a quién enseñar tus posts. Si tu historial es bueno, queda limpio y el modelo te empuja. Si vas acumulando señales negativas (bloqueos, mutes, reports, not_interested), se vuelve tóxico y empieza a penalizarte automáticamente. Y la trampa: NO se resetea. Lo que hagas hoy sigue dentro durante semanas, contaminando todo lo que publiques después, aunque sea bueno.
Por eso salir de un shadowban o de épocas de bajo alcance se siente en X como intentar mover una gigantesca rueda oxidada: no es tu imaginación, es así tal cual. Limpiar/mejorar tu embedding es algo lento y farragoso, es como la impresión que tienes de alguien que te cae mal: por muy simpático que se vuelva contigo, va a pasar bastante tiempo hasta que te fíes de él.
Otro descubrimiento importante: el embedding no decae con un reloj. Decae con engagement NUEVO entrando al sistema. Si dejas de postear, las señales malas viejas se quedan congeladas dentro: nadie las sobrescribe. Si comienzas a crear contenido que al algoritmo le gusta, notarías mejora a partir de las 6-8 semanas y un cambio decente sobre las 12-16 semanas, asumiendo que no acumulas más señales malas en medio.
¿Por qué nadie está hablando de esto? Me parece tremendo y por fin una confirmación de esa sensación de "estoy en una mala racha" por la que todos hemos pasado.
1/ Los primeros 30 minutos lo son TODO
Si tu post no recibe interacciones rápido, Grok ni siquiera lo evalúa. Sin nota de calidad, sin análisis profundo, sin posibilidad de llegar a quien no te sigue. Muerto y enterrado
2/ La edad del post tiene un cap de 80 horas:
POST_AGE_MAX_MINUTES = 4800, en buckets de 1 hora. Después estás en el "overflow bucket" que se traduce como "antiguo, ignorar"
Mejor ventana: las primeras 0 a 12 horas. Pasadas las 24 ya estás en un bucket peor
Vamos, lejos de incentivar el contenido "evergreen", X quiere carnaza fresca continua (todo lo contrario que YouTube)
3/ MI MAYOR MIEDO ERA INFUNDADO (se supone): vivir en EU y postear en inglés para audiencia US: CERO penalización directa en teoría:
El struct PostCandidate no tiene NINGÚN campo de país del autor, IP ni localización. Gizmoduck (el servicio de identidad de X) solo devuelve follower count + screen name. El transformer de Phoenix solo ve un hash de tu author_id
Lo que sí te jode indirectamente: el huso horario (tu post envejece mientras US duerme) y el idioma DEL POST
Vamos, que usar una VPN para "postear desde US" no hace literalmente nada (a diferencia que en TikTok o Instagram, por cierto)
4/ Las 5 señales negativas que matan tu alcance:
El modelo predice 22 acciones por post. 5 son pesos negativos que se RESTAN de tu score:
- not_interested
- block_author
- mute_author
- report
- not_dwelled (gente haciendo scroll sin pararse en tu post)
Esa última es brutal la verdad. Un post que se ignora es matemáticamente PEOR que uno que nunca se llegó a publicar
5/ Los shadowbans existen 100%. Hay 4 tipos distintos:
- Hard drop. X borra tu post del feed de todo el mundo sin avisarte. Se aplica a posts con contenido grave (abuso infantil, etc.) o cuentas suspendidas. Tú ni te enteras
- Etiqueta DO_NOT_AMPLIFY. Es literalmente un campo en el código que dice "no amplificar este post". Si te la ponen, los anuncios dejan de aparecer al lado de tus posts → X deja de ganar dinero mostrándote → el sistema deja de pushearte. Apagón en seco
- Reglas de BotMaker. Es el panel interno desde el que los empleados de X pueden limitar a una cuenta concreta a mano. En el código se ven las categorías que existen (Content, ContentLimited, Safety, Grok) pero NO se ve a quién se las aplican ni por qué. La herramienta está documentada, los usos no
- Embedding envenenado. El más jodido como ya vimos antes. El modelo tiene una "memoria" interna por cada cuenta. Si tu cuenta acumula suficientes "no me interesa" + bloqueos + silencios + reports a lo largo del tiempo, esa memoria se vuelve tóxica. A partir de ahí, incluso tus buenos posts futuros se penalizan automáticamente. Nadie lo decidió. El modelo simplemente aprendió que tu cuenta da mal engagement, y se autocorrigió
6/ Solo los posts ORIGINALES pasan por el "Banger Screen"
Las respuestas y retweets nunca entran en el clasificador de calidad de Grok. Si te pasas el día respondiendo a cuentas virales, estás optimizando para el Reply Ranker, NO para la amplificación
¿Quieres que te descubran fuera de tu red? Escribe posts originales, no hay otra
7/ Las respuestas a cuentas pequeñas pasan por escáner anti-spam. Las respuestas a cuentas grandes pasan por Grok
Dos clasificadores distintos. El SpamEapiLowFollowerClassifier pega a las respuestas a cuentas pequeñas. El ReplyRanker puntúa de 0 a 3 con Grok las respuestas a cuentas grandes
"¡Primero!" o respuestas solo con emojis sacan un 0. El rollo tipo "Sir, this is a Wendy's" se penaliza. Vamos, que si escribes respuestas, más te valen que aporten algo, si no, mejor ni te molestes
8/ El 50% de todas las peticiones al feed son "tráfico shadow"
is_sampled(request_id, 0.5) marca como shadow la mitad de cada feed request. Muchas features contextuales (inferencia de género, demografía, preferencias de topics Grok) solo se activan en shadow O con un feature flag
Traducción: literalmente no puedes saber qué versión del algoritmo está viendo cualquier usuario. La mitad de tu audiencia está en un experimento en cualquier momento
9/ El dwell (el tiempo que un usuario se queda mirando tu post antes de hacer scroll) es 5x veces mejor que recibir likes
El scorer tiene 5 señales distintas de dwell (dwell, cont_dwell_time, click_dwell_time, etc.) pero solo 1 señal de favorito.
- Un post con un montón de likes pero la gente lo lee 1 segundo y sigue scrolleando → score bajo
- Un post con pocos likes pero la gente se queda 8 segundos leyéndolo → score alto
¡Optimiza por tiempo pasado en tu post, no por likes!
10/ Cosas que sí funcionan:
- Engagement en los primeros 10 min. Manda DM a tus colegas, pingea a tu comunidad, lo que sea
- Postea en la zona horaria de TU AUDIENCIA, no en la tuya. Para targetear US: 8 a 11am ET (14 a 17 hora Madrid)
- No postees 5 cosas seguidas. El AuthorDiversityScorer multiplica cada post siguiente tuyo por decay^position. Para el post 4 ya estás en el suelo
- Vídeo ≥ 10 segundos. Por debajo de MinVideoDurationMs pierdes el peso VQV entero
- Vídeos con audio. Grok corre ASR (speech to text) en cada vídeo. Sin audio = señal en blanco
- Cita virales de tu nicho. El modelo ya sabe que el original engancha, tu valor añadido se apila encima
11/ Cosas que te destrozan el alcance:
- DESCUBRIMIENTO DE LA HOSTIA: hilos de más de 10 tweets. El DedupConversationFilter solo deja 1 tweet por conversación por feed. Los megahilos son matemáticamente un desperdicio
- Repostear el mismo contenido. Los bloom filters lo deduplican
- AI slop. Hay literalmente un campo slop_score en el output del BangerScreen. Lo detectan explícitamente
- NSFW/violencia/odio sin etiquetar. Auto MediumRisk = sin ads = shadowban estructural
- Spamear respuestas a cuentas pequeñas. Hay un clasificador específico para eso
12/ Lo que NO han publicado los muy pillines:
El esqueleto es público. Los diales no
- Los valores numéricos exactos de cada peso (FavoriteWeight, ReplyWeight, OonWeightFactor, AuthorDiversityDecay). Viven en xai_feature_switches::Params, config externa
- Los prompts reales de Grok (los 7 prompts de policy PToS, BangerMiniVlmScreenScore, SafetyPtos). Pueden tener literalmente cualquier framing
- Las reglas de BotMaker que aplican DO_NOT_AMPLIFY a cuentas concretas
- util/phoenix_request.rs, que construye la llamada final al modelo
- 25+ crates xai_* referenciados pero no incluidos
- Los pesos del Phoenix de producción. Solo han publicado la versión mini
Mi teoría: nos han puesto un esqueleto algo escuchimizado del total que tienen. El músculo (los pesos) y el cerebro (los prompts y las reglas de BotMaker) son completamente opacos. Se han reservado lo mejor, está claro
13/ Chuleta resumen para no olvidar:
- Los primeros 30 min importan más que cualquier otra cosa
- Tu ubicación es irrelevante, tu timing y tu idioma no
- Los shadowbans existen en 4 sabores. El peor es el modelo envenenándote el embedding de autor en silencio a partir de señales negativas pasadas, levantar caveza limpiando tu embedding te va a costar horrores, pero se puede
- Las respuestas y retweets no pasan por el clasificador de calidad. Los originales sí
- El dwell (que alguien se quede mirando tu post) le gana al like 5 a 1
- La mitad del tráfico está en algún experimento en cualquier momento
- Se han reservado lo mejor del algoritmo, pero bueno, algo es algo
Queridos... por lo que sea, se os ha olvidado hoy publicar el mapita ese de colores con el que lleváis dando la turra un mes
Ese mapita que le sirve a la ministra y al secretario de estado para decir frases de tazas de Mr.Wonderful
Se os ha olvidado el de hoy... por lo que sea
El PSOE ingresó 1,5 millones en donaciones entre 2019 y 2022 durante el periodo en el que Aldama sitúa pagos ilegales de empresarios @entrammbasaguas@eldebate_com
https://t.co/GEvewjw14F #Horizonte