He publicado #bormeparserv2 v1.0.0 🚀
Es un fork modernizado de #bormeparser, el proyecto original de @_pablog Gracias a Pablo por crear la base inicial.
Ahora permite descargar/cachear PDFs del BORME, parsear a JSON, buscar por persona/empresa/cargo/acto/provincia/fecha, usar SQLite o MariaDB, e integrar Qdrant para búsquedas vectoriales.
También incluye Docker, por si quieres probarlo, así rápido.
pip install bormeparserv2
Repo:
https://t.co/9oKINQXI4b
#Python #OSINT #BORME #OpenSource
@Seifreed Hola Marc, ¡qué sorpresa ver que #bormeparser sigue vivo y evolucionando! :D
Me ha llamado especialmente la atención la integración con búsquedas vectoriales; en cuanto saque un rato la probaré 👀
Gracias por darle una nueva vida al proyecto 🙌
Hoy publico en @elmundoes una tribuna en homenaje a Jon González.
Esta semana cerró su cuenta en X. La cerró después de que un activista publicara un hilo destapando que trabajaba en una gran empresa, etiquetara a la compañía y sugiriera que aquello requería investigación interna. La idea de fondo: lo que se dice solo vale por quién lo dice.
Jon descargaba datos del INE, Eurostat y el Banco de España, montaba gráficos limpios y los publicaba a coste cero. Sin tertulia, sin grito, sin teatro. A veces incomodaba a una mitad del país, a veces a la otra. Decenas de miles de seguidores se han quedado sin ese material.
El método importa más que el caso particular. Cuando los números aprietan, el ofendido recurre a la falacia genética con una desfachatez que sería cómica si no fuera tan eficaz. No se discute el dato porque no se puede. Se desplaza la pregunta hacia el empleador del autor. La asimetría es la materia prima: yo etiqueto a tu empresa, tú te juegas el trabajo.
Mientras tanto, España atraviesa la mayor subida real de impuestos de su democracia por la progresividad en frío, el déficit contributivo de la Seguridad Social ronda el 4% del PIB, la vivienda se ha despegado del salario de los jóvenes y la productividad lleva una generación estancada. El país necesita más gente que sepa leer una serie temporal, no menos.
Cada uno de estos episodios entrena al siguiente analista joven a hacerse pequeño. Esa es la factura que pagaremos todos.
https://t.co/JRaMferxVS
La pasarela Cl@ve se cae casi cada semana y el Ministerio no publica datos de operatividad.
Si no lo hacen ellos, lo hacemos nosotros: monitorizamos las caídas de las webs de la Administración Pública
👇
https://t.co/mOXAgVgm1f
En cualquier banco o gran institución financiera como BBVA, si te identificas en redes como empleado, cualquier cosa que publiques puede interpretarse como una postura oficial de la institución y eso solo te puede traer muchos problemas.
Creo que lo de Jon (como la mía y muchos otros que estamos todo el día en X con los datos), es una causa personal que no preocupa enormemente por el futuro de este país y precisamente porque nos dedicamos profeisonalmente a ello tenemos las herramientas y el conocimiento para tener más consciencia que nadie.
Pero este periodista prefiere insinuar que lo oculta porque BBVA le obliga a manipular datos en favor de sus intereses financieros. Eso sí me parece bastante más cercano a la mala fe y a la falta de ética 😂
Los datos son los datos, y si piensas que la información que vierte Jon en esta red es mala o manipulada, como periodistas argumenta con el fondo y no intentes matar al mensajero!
Ojalá muchos más profesionales que conozco en instituciones pudieran participar de la conversación en redes y no lo hacen por miedo a este tipo de periodistas
A mí hay una cosa de Autofirma que siempre me ha puesto muy nervioso.
Cuando estás firmando un documento a través de una web no ves qué estás firmando. Solo te pide seleccionar el certificado, lo firma, y ya.
Que en realidad no se esté firmando otra cosa distinta a la que te ha enseñado en el paso anterior es un acto de fe.
Hay una issue abierta desde 2019 y los desarrolladores lo justifican en que "no debe verse Autofirma como una solución integral de firma".
A mí me parece una deficiencia bastante grave.
https://t.co/BFjCjdnYO9
Ya podéis conectar Claude (o cualquier otro agente AI) con BQuant.
7 bases de datos financieras (y subiendo) conectadas a un servidor MCP accesibles por lenguaje natural en https://t.co/JJqTXYgFBb
-68K fondos y ETFs con métricas de rentabilidad, riesgo y costes.
-79K acciones con 300+ fundamentales.
-Trades del Congreso de EE.UU.
-Compras/ventas de insiders corporativos
-Carteras de 82 superinversores (Buffett, Ackman, Burry...)
-2M noticias de mercado desde 2008.
-Decisiones históricas de la Fed.
Ejecuta queries contra datos reales y devuelve tablas verificables, atacando uno de los mayores problemas de los LLM a la hora de devolver información.
▶️ "¿Qué tiene Buffett en cartera y a qué múltiplos compra cada posición?"
▶️ "Fondos de renta variable europea con Sharpe > 1, coste < 1% y rating 4+ estrellas"
▶️ "¿Qué acciones están comprando a la vez congresistas, insiders y superinversores, y qué fondos me dan exposición a esos sectores?"
▶️ "Compara Cobas Selección, Azvalor Internacional y Magallanes European — métricas lado a lado"
▶️ "Smart money comprando en sectores con noticias negativas — ¿quién está siendo contrarian?"
Ara resulta que:
- La Generalitat fa pública una base de dades
- Un tercer (https://t.co/027zfu95Zc) crea una web per què tothom pugui accedir a la dita base de dades de forma fàcil
- La web té èxit, en tant que permet accedir a informació rellevant, fins llavors, no accessible
- La Generalitat se n'adona que perd el control de la narrativa (5,000M€en subvencions!). Talla l'accés a la base de dades i n'elimina 1 milió de registres
- Es genera polèmica: La Generalitat limita l'accés a dades públiques
- En un alarde de periodisme d'investigació, TV3 diu que les dites webs són vehicles de l'extrema dreta
- Es genera encara més polèmica: Fiscalitzar, auditar és extrema dreta? Sembla que la Unió Europea no pensa el mateix
- Com es resol? Doncs de nou la Generalitat es val de TV3 per anunciar que la base de dades tenia informació privada, i de forma vetllada s'amenaça amb accions legals, no contra la pròpia Generalitat per publicar info privada de forma negligent, sino contra qui ha fet una simple web (interface) d'accés
... és tot tan inacceptable.
2 coses que podeu tenir clares:
1) D'extrema dreta res. La pròpia Europea propugna i promou l'Open Data. Fiscalitzar i auditar és la base d'una democràcia sana.
2) Qui publica i dóna accés a les dades és el responsable últim de garantir que no es vulnera la privacitat de ningú (en terminologia legal, és qui fa el tractament de les dades). Ho diu la legislació europea i ho diu el RGPD. L'intermediari ni tracta, ni reorganitza, ni amplifica les dades; només publica. Amenaçar-lo, intimidar-lo amb accions legals, com s'està insinuant, és francament anti-democràtic...
OPEN DATA: QUAN LA TRANSPARÈNCIA FA POR
Hi ha moments en què una societat es mira al mirall… i no li agrada el que veu.
A Catalunya, aquest moment ha arribat no per una llei, ni per una auditoria oficial, ni per una comissió parlamentària. Ha arribat per dues webs “pirates”: https://t.co/027zfu95Zc i el @Menjometre , similars al que en @JaimeObregon porta anys fent: Fiscalitzar l'administració
No són institucions.
No tenen pressupost públic.
No tenen gabinets de comunicació.
Només tenen una cosa: dades.
I això ha estat suficient per fer tremolar el relat.
Durant anys, l’Administració ha parlat de transparència. Portals oberts, PDFs, dashboards… tota una estètica de modernitat institucional. Però la realitat és una altra: ocultació de dades disperses, difícils d’interpretar, sovint incompletes. Transparència de façana.
Fins que algú decideix fer la feina de veritat. Agafar totes aquestes dades. Ordenar-les. Fer-les intel·ligibles... i el més important, fer-les públiques.
I llavors passa el que sempre passa quan la informació es fa entenedora: Apareix la veritat.
La xifra és contundent: 5.000 milions d’euros anuals en subvencions. Un 11% del pressupost de la Generalitat. No és una línia menor. No és un detall tècnic.
És un model.
Un model que planteja una pregunta incòmoda:
Per a què serveixen aquests diners?
Perquè, mentrestant, el ciutadà paga.
I paga molt. Catalunya té una de les pressions fiscals més altes d’Espanya, especialment en IRPF. Treballes més. Pagues més. I després descobreixes que una part molt significativa d’aquests recursos es redistribueixen en forma de subvencions.
A qui?
Sempre s'ha parlat de mitjans de comunicació, però té lògica: Ningú paga ja pel diari, i si és en català, menys. Per tant, està bé subvencionar-los, però...
Associacions.
Sindicats.
Entitats diverses, que han fet de l'activisme de boquilla un modus vivendi.
Tot un ecosistema. Un ecosistema que, casualment, rarament qüestiona el sistema que el finança.
No cal conspiracions. Només cal entendre els incentius.
Però hi ha una segona capa, encara més preocupant. No és només una qüestió de quantitat. És una qüestió de direcció.
Quan analitzes les dades —i això és el que permet l’Open Data de veritat— no només veus qui cobra.
Veus cap on va el país. O, més ben dit, cap on no va.
El Govern català parla constantment de futur. De sostenibilitat. De transició energètica. D’innovació.
Però després mires les dades… i no trobes rastre d’aquesta narrativa en la despesa real.
Ni un euro rellevant cap a empreses punteres que podrien liderar aquest futur.
Un exemple és especialment simbòlic: @Wallbox_ES
Una startup nascuda a Barcelona, líder en tecnologia de recàrrega de vehicles elèctrics, competint a escala global. El tipus d’empresa que, en altres països, seria objecte de suport estratègic.
Consultem quants contractes públics han rebut per equipar de carregadors elèctrics a l'Administració. Zero.
Consultem quantes subvencions han rebut per accelerar el seu creixement, desde Barcelona cap al món. Zero
Això és el que abans en dèiem —sense complexos— política industrial. Creació de campions nacionals.
Aquí? Zero.
Permeteu-me l'exabrupte, però hi ha milions d'eruos gastats en subvencions en causes peregrines, a païssos remots. No hi ha un euro invertit en promoure l'activitat industrial, innovadora i sostenible a Catalunya.
I aquí és on l’Open Data esdevé perillós.
Perquè ja no es tracta d’opinions. Ni de relats. Ni de discursos.
Es tracta de dades.
I les dades expliquen una història molt diferent de la que se’ns ven:
Una Administració que recapta com si fos escandinava… però gasta sense una estratègia de futur clara, només per acontentar panxacontents.
Una Administració que parla d’innovació… però no aposta pels seus innovadors.
Una Administració que distribueix recursos… però no transforma l’economia.
L’Open Data no és només una eina tècnica.
És un mecanisme de control democràtic.
Perquè la transparència real no consisteix en publicar dades. Consisteix en fer-les comprensibles.
I, sobretot, en acceptar les conseqüències del que revelen, i donar explicacions.
Potser per això iniciatives com https://t.co/027zfu95Zc incomoden tant. Perquè no creen informació nova.
Només fan visible el que ja hi era.
I quan això passa, la pregunta deixa de ser tècnica i esdevé política: Estem utilitzant els recursos públics per construir el futur… o per gestionar el present?
Europa, amb totes les seves dificultats, està immersa en processos de reconversió. Indústria verda. Soberania tecnològica. Reindustrialització.
No és fàcil. No és indolor.
Però hi ha direcció. Aquí, en canvi, el risc és un altre:
Confondre estabilitat amb inèrcia. I despesa amb política.
L’Open Data ha obert una porta. Ara la qüestió és si volem mirar a dins… o tornar-la a tancar.
Perquè un cop has vist les dades, ja no pots fer veure que no hi són.
I aquesta, al final, és la seva veritable força.
No me lo puedo creer. 275.000 euros.
Eso es lo que ha costado la web y app infoDANA.
Ha tenido menos de 1000 visitas y 700 descargas.
A 275 euros la visita.
Todo lo que está mal:
- No es de código abierto
- Las cookies y el tracking no cumplen LSSI-CE ni RGPD
- No cumple criterios básicos de accesibilidad
- Coste desproporcionado para una web informativa
- Dinero público sin retorno claro para la ciudadanía
Me parece perfecto que se haga una web y una app para esto.
Pero necesitamos gente con conocimientos técnicos para definir bien los requerimientos y los presupuestos.
Porque con la programación ya vamos tarde.
Y con la IA, si seguimos así, vamos a estar en la edad de piedra.
Me llevan los demonios, el INE ha roto la serie de viviendas turísticas cambiando los meses de referencia de Febrero-Agosto a Noviembre-Mayo y, casualidad, el cambio da como resultado una caída que el ministerio instrumentaliza a su favor. Vergonzoso al nivel del CIS de Tezanos.
¿Cómo puede ser que el INE, en su estadística experimental de viviendas turísticas, rompa la serie histórica (reportaban en Febrero y Agosto), la cambien a Mayo y Noviembre y se queden tan panchos? Máxime cuando la información viene de webscrapping ¿Hay alguien a los mandos?