AI Product Manager @bergerlevrault |
Economist | Data Scientist | Applied Economics Researcher.
Passionate about AI, programming, and tech. Learning by doing.
No, el Atlético de Madrid nunca haría algo así. Sin embargo, en los últimos meses venimos sufriendo una campaña de acoso y derribo sobre uno de nuestros jugadores. Filtraciones interesadas, 'fake news', faltas continuas de respeto, la versión culé de la maquinaria inventando historietas, llamadas antes de enfrentamientos directos... Pero claro, a nosotros tampoco se nos ocurriría tener a sueldo al vicepresidente de los árbitros o recurrir a favores políticos para inscribir a jugadores. RESPETO y VALORES.
Bajo la estructura de Cloudflare opera medio internet, que vuestro dueño encubierto, que financia esta propaganda burda, está tirando constantemente bajo el amparo de un juez con aires de grandeza, anteponiendo vuestro lucro económico al derecho de miles de usuarios @diarioas
The non-English tax is real.
Sutton's Bitter Lesson, translated across languages and normalized to OpenAI English token count:
Hindi: OpenAI 1.37×, Anthropic 3.24×
Arabic: OpenAI 1.31×, Anthropic 2.86×
Chinese: OpenAI 1.15×, Anthropic 1.71×
Claude’s tokenizer charges a much higher linguistic tax.
A la mínima que hayáis leído el análisis hecho por AISLE os daréis cuenta de que la crítica hecha aquí no tiene fundamento.
El motivo es que AISLE no ha reproducido realmente la tarea que Mythos ha resuelto (dejar que el LLM escanee proyectos completos hasta encontrar sin intervención humana las vulnerabilidades).
En el caso de AISLE se les ha dado como input al sistema las zonas de código más delicadas, ya conocidas previamente a través de los reports de Anthropic, para examinarlas con modelos menos potentes que sí han encontrado las vulnerabilidades que se esperaban. Es decir, no se está evaluando la capacidad de búsqueda real, sino la capacidad de análisis una vez el problema ya ha sido prácticamente aislado.
Y de ahí se ha saltado a concluir "los modelos menos potentes hacen la misma labor que Mythos", lo cuál es erróneo.
Por hacer una analogía sería como si a mi me ponen a buscar una aguja en un pajar y la encuentro tras mucho trabajo duro. Mientras que a otra persona le señalan la aguja entre toda la paja y le preguntan ¿es aguja o es paja? y al acertar concluyen que nuestras capacidades son iguales.
--
Soy el primero que cree (opinión) que Anthropic no saca a Mythos no por miedo, sino por falta de computación para poder desplegarlo. Lo dije en mi vídeo y ya lo dije incluso cuando surgieron las primeras filtraciones hace unas semanas.
Pero eso no es incompatible con que el modelo sí representa un salto en capacidades inesperado, al menos por lo visto sobre el papel. Y que gran parte de la gente que trabaja en Anthropic sí se toma muy enserio los riesgos tras estos modelos (en algunos puntos rozando una paranoia exagerada, a mi gusto).
Reducirlo todo a "lo hacen porque marketing, porque IPO, porque dinero, porque 2019..." es hacer una sobre-simplificación de la situación que minimiza riesgos reales de desplegar este tipo de modelos al públicos.
Por ejemplo, argumentar que porque "George Hotz (hacker famoso) dice que es capaz de encontrar 0days con facilidad, porque no es tan difícil pero que no hay incentivos para buscarlos, y que por tanto lo de la IA no es tan impresionante", es mover el foco de donde está el problema. Es el equivalente a decir que los deepfakes no son un problema porque ya los profesionales de efectos especiales antes lo hacían con software de FX. El problema no es de capacidad sino de escala. Antes sólo unos pocos podían hacer eso y hoy en día con la IA y muy pocos recursos, cualquiera podrá hacerlo. La democratización de estas capacidades es "el problema" al que nos enfrentamos con una incertidumbre total. Quizá no pase nada. Quizá estemos jodidos. O quizá sea algo intermedio.
Ya os digo. A día de hoy si yo fuera el líder de una de estas empresas no tendría claro cuál sería la decisión más acertada a la hora de desplegar este tipo de modelos cada vez más potentes en abierto al público.
No terminamos de poner en contexto estas cifras, es una auténtica barbaridad. Es prácticamente el PIB de Taiwán, con TSMC incluido, es un sinsentido absoluto
Today, we closed our latest funding round with $122 billion in committed capital at an $852B post-money valuation.
The fastest way to expand AI’s benefits is to put useful intelligence in people’s hands early and let access compound globally.
This funding gives us resources to lead at scale. https://t.co/sY7YNUPSYO
@GoogleAIStudio@googledevs Since the update, real-time collaboration on a single product is gone. It now creates separate remixes with no way to merge them into one project; we’ve been forced to abandon the tool 🥲