@DragorWW По моему опыту правильно спроектированный продуктовый манифест отлично фильтрует попытки агентов (или людей) взломать продуктовый слой. Инверсные фитнес функции - фильтр на ADR, фитнес функции - на RFC.
@ivan4th Fable 5 после demo периода, скорее всего, уйдет в тот же tier, что и gpt-5.5-pro, o3-pro - будут использовать только те, кому это реально нужно, остальные пропажи не заметят
@bodryachog Он хорош для сложных investigations, думает/скриптует лучше, так и до цели быстрее добирается. Opus и GPT 5 тоже добираются, но им чуть больше подсказок нужно. Для обычной разработки он слишком во всём, цикл Opus (архитектор, кодер) и GPT 5.5 (review) пока выглядит эффективнее
@Suvitruf Если у тебя есть подписка ChatGPT уровня Plus и выше, то попробуй добавить в процесс перекрестные ревью с Codex, у них разные harness, поэтому даже без особой настройки тот же GPT 5.5 xhigh вытянет из планов Opus то, что тот пропустит даже после серии self review
@_architected Gemini Pro базово более «живые» тексты пишет, можно ставить в пайплайн как редактора/корректора для документации после research/discovery фазы
@Nekrolm Полностью определяется контекстом. То же ревью на одном и том же бранче с той же моделью может стоить от 2 до 50 баксов. Если интересны свои цифры, то можно начать с утилиты типа codeburn
Попытки строить системы памяти для агентов на основе того, как это устроено у человека, дают красивые концепцию, но ложные надежды. Агенту не нужен семантический поиск, но нужны task-aware контекст и система гейтов на выдачу и пополнение. Да и контекст пока маловат
@andrew__romanov Проблема такого наивного классификатора для оценки scope/выбора LLM для review в том, что однострочное изменение может вызвать регрессию на call chain на 2-3 уровне, и LLM с заниженным effort этот risk surface гарантированно пропустит
Если нефункциональные требования к ПО описывать через fitness function и трактовать как differientable object, то это решает проблему с accidental сложностью решений (Gall's Law), но уводит нас в эпоху пост-программирования настолько, что мы к этому ещё не готовы
@TopoRUS@Suvitruf Есть ещё риск того, что может некорректно замерять температуру (занижать), если холодный воздух будет локализоваться в этой области над шкафом
@Suvitruf Парадокс в том, что если компания задумывается о найме такого человека, то она, скорее всего, уже опаздывает. А если считает, что не нужен, то уже опоздала.
@DragorWW Это закрывает лишь часть кейсов с дрифтом плана и реализации, но увеличивает расход токенов и требование к размеру контекста, поэтому без смены парадигмы - путь привлекательный, но тупиковый
@MLarchanka@AntiPlayerBs Asciidoctor - недооцененная жемчужина для SDD. Как стандарт шире по возможностям, из коробки поддерживает макросы/include/inline инструкции с разными препроцессорами, что позволяет экономить токены при работе с большими документами (переписать кусками, сгенерировать TOC и т.п.)