часов, причём ограничением могла быть сама методика оценки.
К маю 2026 года Claude пишет больше 80% кода, который попадает в кодовую базу Anthropic. В одном кейсе модель выдала больше 800 фиксов и снизила целый класс API-ошибок в тысячу раз. По оценке инженера, человеку на такой объём работы понадобилось бы около четырёх лет.
В проекте по безопасности агенты закрыли 97% разрыва в производительности, тогда как два разраба за неделю закрыли 23%. В выборе следующего исследовательского шага модель уже показывает 64% попаданий против человеческого решения.
Решения людей пока держатся на: какие задачи выбирать, когда менять направление, когда признать тупик и не продолжать копать.
Авторы рассматривают три развилки. В первой рост упирается в плато, и этому варианту они дают меньше всего веса. Во второй эффективность продолжает накапливаться, люди задают направление, а небольшая команда делает объём работы, который раньше требовал тысяч специалистов. Этот сценарий выглядит для них наиболее вероятным. В третьей начинается полноценное рекурсивное самоулучшение, где темп всё сильнее определяется доступным компьютом. Именно по этому сценарию у Anthropic меньше всего уверенности в безопасности.
Люди пока сильнее в том, что не сводится к простому выполнению задачи: выбрать правильное направление, вовремя сменить подход, понять, что задача плохо поставлена, и остановиться, когда решение больше не окупает усилия.
Anthropic описывает три возможных сценария.
Первый - прогресс упирается в плато. Модели становятся лучше, но рост быстро замедляется. Авторы считают этот вариант наименее вероятным.
Второй - модели продолжают усиливать команды, но направление всё ещё задают люди. Небольшая группа специалистов с ИИ делает объём работы, который раньше требовал тысяч человек. Этот сценарий выглядит для Anthropic самым вероятным.
Третий - полноценное рекурсивное самоулучшение. ИИ всё активнее участвует в создании следующих поколений ИИ, а скорость прогресса начинает зависеть в первую очередь от доступных вычислений. По этому сценарию у Anthropic больше всего вопросов к безопасности.
https://t.co/0ItV4h15hD
Скелет тираннозавра «Гас» уходит с молотка на Sotheby's 14 июля. Оценка до 30 миллионов долларов, и это может стать самым дорогим динозавром в истории аукционов.
183 кости, около 82% скелета, череп длиннее метра. Нашли в 2021 году на ранчо в Южной Дакоте.
NVIDIA выкатили Nemotron 3 Ultra (550B-A55B) - свою самую сильную open-weight модель на сегодня, причём вместе с полной схемой обучения.
Главный фокус на эффективность инференса в реальных long-context agentic сценариях, где модель долго держит контекст, работает с инструментами и выполняет многошаговые задачи.
Открыли почти всё:
• base-модель
• post-trained версии
• reward checkpoints
• NVFP4-квантованные версии
• тренировочные данные
• рецепты обучения
Технически внутри тоже интересно:
• 550B параметров всего, 55B активных
• гибридная архитектура Mamba2 + Transformer
• примерно 4:1 в пользу Mamba относительно Attention
• претрейн в NVFP4 на 20T токенов
• LatentMoE-архитектура
• двухэтапный MOPD post-training
• нативная поддержка MTP
🤗BF16 checkpoint: https://t.co/IsheiXvuX4
🤗NVFP4 checkpoint: https://t.co/N2d6puOiVl
📜Technical Report: https://t.co/dIg5mh4PLd
В MIT учат операционным системам не по слайдам, а на живом ядре.
Студенту дают рабочее ядро в духе Unix и предлагают самому в нём копаться, ломать и переписывать. Называется xv6, это переосмысление шестой версии Unix 1975 года на современном C под RISC-V.
Всё ядро около 6000 строк, его реально прочитать целиком. Процессы, системные вызовы, виртуальная память, файловые дескрипторы, каналы и планировщик прямо перед тобой.
Реализация чтения из pipe в kernel/pipe.c укладывается примерно в 15 строк и объясняет про синхронизацию больше, чем целая лекция про мьютексы.
Книга и исходники открыты и бесплатны:
https://t.co/xEQ4Eq22An
✔️ Ideogram релизнул четвертую версию T2i модели
Ideogram 4.0 получила поддержку разрешения 2K, создание прозрачного фона и позиционирование объектов через bounding boxes. Сохранен фокус на качественном рендеринге текста для логотипов и постеров.
На DesignArena, модель заняла 1 место среди открытых решений, уступив только проприетарным системам OpenAI и Google.
Код и веса опубликованы в открытом доступе. Для коммерческого применения требуется покупка платной лицензии.
Доступен API стоимостью от $0.03 до $0.10 за генерацию в зависимости от качества. Модель есть на площадках ComfyUI, Replicate и Leonardo AI.
В будущих обновлениях обещают добавить работу со слоями и редактируемый текст.
10 марта 2016. AlphaGo сделал ход с вероятностью 1 из 10 000.
Ли Седоль встал и ушёл на 15 минут. Вернулся. Проиграл.
Через 3 года ушёл из профессионального го, объяснив двумя фразами: "Есть сущность, которую невозможно победить."
Ход 37 и ход 78 - оба с вероятностью 1:10000. В разных направлениях.
https://t.co/GcZkVcFRk3
Anthropic изучила 832 заблокированных аккаунта и сопоставила их с MITRE ATT&CK. Вывод: ИИ всё чаще берёт на себя самые сложные стадии атаки уже внутри сети, а старые метрики риска перестают работать.
Разбор: https://t.co/ZoBzTuVFKp
10 open source проектов с GitHub, которые заменяют софт за тысячи долларов в год.
1. TradingAgents. Команда ИИ-аналитиков, которая торгует на реальных рынках
https://t.co/BIXXshS6fc
2. LibreChat. ChatGPT, Claude, Gemini и ещё 20 моделей в одном self-hosted интерфейсе
https://t.co/gk1PzAHuw8
3. HyperFrames. Пишете HTML, агент рендерит MP4. Видеодвижок HeyGen
https://t.co/XaTpmSrec6
4. Fincept Terminal. Bloomberg за 24 000 в год прямо на ноутбуке, бесплатно
https://t.co/bwullcfFsi
5. MoneyPrinterTurbo. Слово на входе, готовое видео со сценарием и музыкой на выходе
https://t.co/6Y5yRuvJbM
6. Agentic Inbox. Email-клиент от Cloudflare, где агент читает почту и пишет ответы
https://t.co/CHvW7JRS8v
7. VoxCPM2. Клон любого голоса по 3 секундам аудио, 30 языков
https://t.co/wbB2fsPSlA
8. Flowsint. Вводите домен, получаете граф из IP, поддоменов и профилей. OSINT локально
https://t.co/m4w6LM4PeS
9. addyosmani/agent-skills. Навыки для Claude Code от инженера Google, 23 рабочих процесса
https://t.co/b93CPEyMTx
10. Nango. Слой интеграций за 50 000 в год, 700 готовых API
https://t.co/1iOwp013rK
Выбирайте один, ставьте и подключайте к работе. Всё бесплатно и open source.
✔ Anthropic обнулила лимиты после сбоя в Claude Code
Компания сообщила (https://t.co/jI3sPDzu2D), что полностью сбросила пятичасовой и недельный лимиты для всех подписчиков тарифов Pro и Max.
Это решение должно компенсировать платным пользователям повышенный расход ресурсов, вызванный программным сбоем.
Причиной проблемы стало то, что некоторые сессии Claude Code ошибочно запускали большое число параллельных субагентов. Из-за этого квоты расходовались заметно быстрее, чем предполагалось.
Пользователи жаловались в соцсетях на аномально быстрое исчерпание квот при работе с Claude Code: в ряде случаев дневной лимит заканчивался уже после нескольких простых запросов.
В сообществе разработчиком высказывались предположения, что резкое сокращение доступных квот связано с новой версией функции Dynamic Workflows. Anthropic это опровергла.
Согласно пояснению, причина кроется в особенностях обработки запросов к Opus 4.8: из-за них модель инициировала больше одновременных вызовов инструментов, чем было заложено.
Сам сбой, как утверждается, уже устранён.
#news #ai #ml
We've reset 5-hour and weekly rate limits for all users on Pro and Max plans.
We fixed an issue that caused some Claude Code sessions to spawn excessive parallel subagents, burning through usage faster than expected.
Физик 12 дней наблюдал за Claude Code, пока агент писал астрофизику. Агент нашел множитель, который прошел все тесты. Число было физически бессмысленным. Агент не знал. Физик знал.
Разница между интеллектом и интеллигентностью.
https://t.co/B2lN7lfVPZ
✔ OpenAI добавила в Codex нетехнические плагины
Компания выпустила обновление Codex для пользователей без технического бэкграунда. В продукт добавили 62 ролевых плагина и 110 функций для аналитиков, дизайнеров, инвестбанкиров и специалистов по продажам.
Среди новых инструментов - Sites для конвертации отчетов в интерактивные веб-страницы и Annotations для редактирования фрагментов текста или таблиц через промпты.
Платформа открыта для сторонних разработчиков. Первыми партнерами по интеграции стали Wix, Figma и Replit. Планируется релиз плагинов для корпоративных финансов, консалтинга и юриспруденции.
Прирост нетехнической аудитории в 3 раза опережает рост базы разработчиков, OpenAI отчиталась (https://t.co/hQ9bgGwDWX) о еженедельной аудитории в 5 млн человек.
https://t.co/YYbir1K3o8 (https://t.co/XNB20o4Ze2)
ИИ хорошо объясняет науку задним числом, но слабо предсказывает её будущее
Исследование на 4760 научных событиях:
- В multiple choice модели неплохи - ответ рядом
- Предсказать, будет ли открытие - около случайного угадывания
- Когда придет прогресс - сдвигают дату слишком далеко
- Больше данных немного помогает, но не решает проблему
Много научных знаний != хороший прогноз
Бумага: https://t.co/XY0pt594bZ
Нью-Йорк тонет под собственным весом. Больше миллиона зданий давят на землю как 1,9 миллиона Boeing 747, и город оседает до 4,5 мм в год. Виноваты не только небоскрёбы: рыхлые грунты, грунтовые воды и эхо ледникового периода тоже тянут его вниз. Паниковать рано, но процесс реальный.
Трамп подписал указ о проверке фронтирных ИИ-моделей на киберугрозы.
Ведущих разработчиков попросят добровольно отдавать сильнейшие модели на тест перед релизом, ведомства получат до 30 дней. Касается только моделей выше порога по киберспособностям, который определяют АНБ и другие. Без обязательных лицензий.
https://t.co/zt31EtY8F6
✔ США ввели добровольную проверку закрытых ИИ-моделей перед релизом
Президент США подписал указ о кибербезопасности в сфере ИИ. Разработчикам передовых закрытых моделей предлагают добровольно предоставлять государству доступ к продуктам за 30 дней до релиза для аудита безопасности и поиска уязвимостей.
Изначальный 90-дневный период проверки сократили (https://t.co/U2bvy0yJl7) по требованию IT-индустрии. Финальный документ прямо запрещает вводить обязательное государственное лицензирование и принудительную премодерацию.
Одновременно Минфин, Пентагон и АНБ создадут совместный координационный центр. Структура займется защитой правительственной IT-инфраструктуры: автоматизирует сканирование федеральных систем и будет координировать противодействие кибератакам с использованием нейросетей.
https://t.co/O14znfVbbZ (https://t.co/zt31EtY8F6)
📌 Кейноут первого дня Microsoft Build 2026
2 июня в Сан‑Франциско открылась (https://t.co/LD3Z7q5ist) ежегодная конференция для разработчиков Microsoft Build 2026. Программный доклад провёл гендиректор компании Сатья Наделла, центральная тема - агентные системы.
На открытии выступили: глава Nvidia Дженсен Хуанг (по видеосвязи), гендиректор Qualcomm Кристиано Амон и создатель OpenClaw Питер Штайнбергер.
В первый день компания представила несколько групп продуктов и сервисов.
🟡Новые модели
Гендиректор Microsoft AI Мустафа Сулейман анонсировал (https://t.co/3lPRd97JYK) семейство из 7 новых моделей MAI для работы с изображениями, голосом, транскрипцией и кодом.
Среди названных - MAI‑Thinking‑1 (https://t.co/u5ziK3fyIG) (ризонинг-модель, обученная без дистилляции с 35 млрд активных параметров и окном контекста 128K), MAI‑Code‑1-Flash (https://t.co/O95h6Wajdu) (заточена под GitHub и VS Code), а также MAI‑Image‑2.5 (https://t.co/8o9GOgDNxZ) и MAI‑-Voice-2 (https://t.co/N4i0UVioKq).
🟡Агенты
Microsoft представила новую категорию Autopilots, всегда активных агентов с собственной идентичностью, работающих в фоне и действующих от имени пользователя.
Первым стал Scout (https://t.co/oiloaDkk5G) - персональный ассистент в Windows, построенный на OpenClaw. Он работает с приложениями Microsoft 365 и предназначен для фоновых задач (ведение календаря, отчётности по расходам и подготовка писем).
Scout доступен в режиме превью для клиентов программы Frontier в США.
Также анонсирован Microsoft IQ, слой контекста для агентов (Work IQ, Fabric IQ, Web IQ), который станет общедоступным в GitHub Copilot, Foundry и Copilot Studio.
🟡Инструменты для разработчиков
Сообщили о запуске десктопного приложения GitHub Copilot (https://t.co/m9WbHOC2J7) (в режиме предварительного доступа), функции Frontier Tuning (https://t.co/mbYwbcRn9J) для дообучения агентов в рамках корпоративных требований (закрытый превью), а также Project Rayfin (https://t.co/Eve2J815C8) - управляемого бэкенда на платформе Microsoft Fabric.
Windows получает функции для разработчиков: набор Coreutils (Linux-подобные утилиты командной строки, работающие в Windows 11 нативно), создание и запуск Linux-контейнеров через WSL и новый Intelligent Terminal, передающий контекст ИИ-агенту.
Отдельно показали платформу Project Solara для устройств, которые работают на ИИ‑агентах. Microsoft показала два референс‑дизайна (настольный хаб с распознаванием лица и носимый бейдж с камерой и расшифровкой разговоров).
🟡Облако и инфраструктура
Анонсировали виртуальные машины Azure Cobalt 200 (https://t.co/yyN6myYDMM) (сказали о приросте производительности на 50%), ускоритель второго поколения Maia 200, базу данных Azure HorizonDB (https://t.co/KCEuP131Pf) на основе PostgreSQL, а также Foundry Local на Azure Local для развёртывания суверенного ИИ.
🟡Квантовые вычисления и медицина
Спустя год после чипа Majorana 1 Наделла представил Majorana 2 (https://t.co/UQ1MSSKdu8) - следующее поколение, компания заявляет о кубитах примерно в 1000 раз точнее за счёт нового материала на основе свинца и о цели создать квантовый компьютер к 2029 году.
На второй, заключительный день конференции, ожидаются технические сессии и демонстрации по агентам, Copilot, Azure Foundry и локальному ИИ в Windows.
#news #ai #ml
Microsoft выкатил целый набор MAI-моделей без громких анонсов:
MAI-Code-1-Flash - планирует и пишет код от начала до конца, меньше дебаггинга
MAI-Thinking-1 (35B активных, ~1T MoE) - конкурирует с Claude Opus 4.6 на SWE-Bench Pro
+ MAI Image 2.5, MAI Voice 2, MAI Transcribe 1.5
https://t.co/aKUcjJMdJT
Bloomberg вскрыл внутреннюю кухню Valve. Гейб Ньюэлл публично отчитал юриста за предложение усилить модерацию Steam: "Зачем я тебе вообще плачу?" В Valve нет иерархии - что помогло им уйти от ответственности в антимонопольном суде.
Google владеет 7% SpaceX и 14% Anthropic.
$900 млн в SpaceX (2015) = $126 млрд сейчас (140x)
$13 млрд в Anthropic = $135 млрд сейчас (10.4x)
Итого $261 млрд на двух ставках, 18.8x возврат - и ни одна компания ещё не провела IPO.
Источник: https://t.co/ojSLi0X6Ma
GOOGLE'S INVESTMENTS SHOULD BE STUDIED.
Google owns 7% of SpaceX and 14% of Anthropic, two of the biggest IPOs in history, both listing this year.
$900 million invested in SpaceX in 2015 is now worth $126 billion, a 140x return.
$13 billion invested in Anthropic is now worth $135 billion, a 10.4x return.
Those two stakes are now worth $261 billion combined, an 18.8x blended return before either company has even gone public.