В конце прошлого года появилась новая тема для психоза вокруг нейосетей. На этот раз ей стали кодинг агенты.
AI лабы выпустили новые модели, поделали обновлений софта. И оно вдруг заработало на недоступном ранее уровне.

Но спустя несколько месяцев у нас есть не просто чьи то слова, а подтверждение в цифрах.
Агентские системы начали делать работу, за которую бизнес готов платить. Причем в таких масштабах, к которым не был готов никто.
Дальше расскажу про то, почему это уникальный момент в истории, почему к нему никто не готов и какие выводы я сделал для себя лично.
Про цифры
OpenAI и Anthropic возможно скоро решатся на IPO. И поэтому с большим энтузиазмом постят сколько они зарабатывают.
И это пиздец.
Это очень много денег.
Anthropic с начала года выросли в 3 раза. При том, что они уже большая компания. А чем ты больше, тем сложнее продолжать расти с прежней скоростью.

Даже когда складывались уникальные условия в прошлом, таких цифр не было ни у кого (с натяжкой, поясню ниже). Например, Zoom в пандемию, Google в момент их выхода на IPO, Coinbase когда они заработали на комиссиях на хайпе крипты. Это компании, которые в 5-10 раз меньше Anthropic, которые находились в особой ситуации и все равно росли медленнее.

С натяжкой, потому что во первых были еще производители вакцины во время пандемии, а во вторых цифры Антропиков - это прогноз на остаток года по его началу. Но это кмк не особо важно и мои выводы не меняет:
1 - Бабки это крутой признак реального спроса на агентские системы.
Когда в прошлом году куча людей вдруг узнало, что ChatGPT умеет генерить классные картинки, к большим деньгам это не привело.
Сейчас же, только за один январь число коммитов от Claude Code на GitHub (в публично доступных репах) выросло с 2% до 4%. Если кажется мало, то учтите, что это всего за месяц и без учета Кодекса, Копайлота и Девина.
К концу года ребята прогнозируют что Клод дорастёт с 4% до 20%+.

Даже если подписка за 100$ может автоматизировать небольшую часть работы, это все равно не сравнится с зарплатой специалиста. Для медианной зарплаты в 350-500$ в день, ROI подписки для 10% самой простой и рутинной работы человека будет в 10-30 раз больше.
То есть - агенты доказали, что они могут делать ценную работу, за которую компании готовы платить. Это хайп, подкреплённый экономической ценностью, а не картинками для соцсетей.
И прикол в том, что мы только в начале пути. Спросу есть куда расти, тк агентами пользуются пока только самые шустрые. К ним потихньку подтянутся и все остальные.
И ...
2 - Индустрия к этому не готова.
Индустрия не готова к такому росту
Чтобы не говорить про абстрактную индустрию, поделю ее на 3 слоя.
- ИИ лаборатории делают модели. OpenAI, Anthropic, DeepMind.
- Гиперскейлеры строят датацентры. Google, Amazon, Microsoft, Meta.
- Производители чипов производят чипы. Nvidia, TSMC, ASML.
И на всех слоях компании ссутся.
Люди в интернете любят поговорить про пузыри. Так вот все эти компании внезапно в курсе, что пузыри случаются. И чтобы не обанкротиться, каждый изобраетает свои способы.
Dario Amodei говорит, что планы компании он строит из негативного сценария по выручке. Забавно, что в этом году они его уже в полтора раза превышают. А от года всего 3 месяца прошло. Позитивный сценарий правда тоже превышают.
Дваркеш на интервью прямо спросил, как так. Ведь Дарио верит в невероятную пользу от ИИ в будущем. Пишет про это большие эссе, питчит про "страну гениев внутри датацентра". И при этом не хочет закладывать бабки по максимуму в это самое будущее.
Дарио говорит, что это опасно из за кассового разрыва в бизнес модели.
То есть, они предоставляют юзерам нейронки. Платят за инференс владешьцам железа и получают деньги с подписок и API. А параллельно с этим инвестируют бабки в ресерч на создание модели следующего поколения. Зарабатывать с которой начнут только через год или два.

Ты балансируешь не просто доходы с расходами, но еще и инвестиции в будущий рост. И если сильно вложился, а роста не случилось - у тебя огромные проблемы.
В таком режиме Антропики живут уже три года подряд. Каждый год растут в 10 раз. Дарио предполагал, что в 2026 это закончится. Ведь чем ты больше, тем сложнее.
Про что он в интерью не говорил, это про то, что их маржинальность растёт медленнее, чем должна по прогнозу. Расходы растут в разы быстрее того, что они закладывали в свои планы.
Дарио говорит, что он хочет вывести компанию в зону прибыльности через несколько лет. Для этого нужно улучшить маржинальность. То есть, замедлить рост и консервативно инвестировать деньги только на самые эффективные штуки.
Логика складная. А вот замедлиться чего то не выходит. Как будто они в этом году готовы снова в 10 раз вырасти. Но ресурсов под это не заложено.
Антропикам не хватает мощностей для такого количества пользователей.
Они арендуют видеокарты у гиперскейлеров. И не могут просто прийти в датацентр и попросить больше. Потому что у владельца датацентра тоже есть риск подорваться на пузыре. Поэтому все обьемы расписаны заранее.
Чтобы Anthropic смогли заработать $30B в год, кому то пришлось потратить $80B на инфстуктуру. С расчётом, что все это окупится за несколько лет.
Amazon в этом году потратит примерно $200B, Google $180B, Meta $125B, Microsoft $105B. Это задел на триллионы экономической ценности в ближайшие годы.
И риск кассового разрыва, если ценности не случится.
Индустрия - это длиннющая цепочка создания ценности. И каждый в ней старается снизить для себя риски, фиксируя ожидания в контрактах. Что снижает способность всей цепочки реагировать на неожиданности. Такие как, например, рост популярности агентов.
Это приводит к тому, что каждый год лабортории ограничены чем то новым. И ограничения потихоньку сьезжают к тем, кто дальше в цепочке от конечного юзера. Потому что их риски больше, а контракты еще менее гибкие.
Ограничения постоянно разные
В 2023 все гонялись за видеокартами. А точнее у заводов TSMC не хватало мощностей для финальной сборки чипов в модули (CoWoS).
В 2024 случился дефицит HBM памяти для тех же модулей.
В 2025 с картами стало лучше, но для датацентров начало не хватать энергии.
В 2026 стало понятно, что даже если энергия есть, электрическая сеть США не может ее доставлять в нужных обьемах до датацентров.
Дальше подробнее.
1 - Память
Свременным моделям память нужна больше, чем раньше.
Я выше писал, что компании тратят сотни миллиардов в год на инфраструктуру. По прикидкам примерно 30% из них - это на память.
Причем им приходится закупать дорогую HBM вместо дешевой DDR. Потому что высокая пропускная способность помогает видеокартам не простаивать пока память обрабатывает свою часть. Дорогая память не такая уж и дорогая в сравнении с полной стоимостью видеокарты.

Скорее всего цены на память будут расти, если не придумают как это обходить. Могут спокойно еще в 2-3 раза вырасти, потому что SK Hynix и Samsung контролируют 90% рынка. А спрос на память только растёт.
2 - Энергия и датацентры
xAI показали, что датацентры можно строить довольно быстро.
Но большая инфраструктура не выдерживает, когда в каком нибудь регионе за полгода появляется штука жрущая электричество как небольшой город. Я уже привык к новостям, что технологические компании начали закупать старые электростанции.
Удивительно, что челик из Semianalysis за энергию особо не беспокоится. Новые электростанции, трансформаторные и банально вышки для проводов строить долго. Но пока электическая сеть адаптируется к новой нагрузке, питать датацентры можно от промышленных турбин на газу. Буквально подвозишь к датацентру десяток трейлеров с генераторами и всё.
Еще есть всякие поршневые двигатели, солнечные панели и батареи, химические реакторы на водороде, судовые двигаетли... Короче, что только не придумали за время существвни топливной индустрии. И в совокупности вместе с эффективным использованием электросети это может дать сотни гигаватт мощностей.

Чтобы строить дата-центры и реакторы быстро, не хватает квалифицированной рабочей силы и банально электриков.
Дорого и трудоёмко, но оказывается все еще проще, чем цепочка поставок полупродневников.
3 - Производство полупроводников
Есть заводы (в основном TSMC), собирающие видеокарты определённой эры (по чертежам Nvidia или Google). Напрмер, по 3-нанометровому процессу.
Ну и просто не построено достаточно заводов.
Быстро это не исправить, потому что это одни из самых сложных промышленных объектов на планете. Чтобы такой построить, нужно 2-3 года и куча специализированного оборудования и химических штук.
Самое сложное - это литографические машины (EUV scanner). Они нужны, чтобы отливать чипы на вафельницах. Которые потом соединяют в модули с памятью и получаются видеокарты.
Так вот эти машины стоят ~$350M за штуку. Делает такие только одна компания из Нидерландов - ASML. Где то по 50 машин в год.

Можно прикинуть, что к 2030 году в мире их будет в ~700. Это порядка 200 гигават вычислений на всех.
На конец 2025 мы тратили ~27 гигават. Это до бума агентов.
Короче, расти есть куда, но будет постоянный дефицит, ограниченный строительством заводов, ограниченный памятью и вафельницами, ограниченный машинами для литографии.
То есть это такие ограничения, которые нельзя залить деньгами в отличие от памяти и энергии для датацентров.
Это хорошо видно на поведении Google.
У них есть свой дизайн чипов. И при этом они четверть чипов закупают у Nvidia. Они бы с кайфом свои делали, вот только не могут.

Все чипы собирают заводы TSMC по чужим чертежам. А Google и Amazon (у них тоже есть свой дизайн) проспали момент когда Jensen Huang назаключал контрактов на производство аж на 70% мощностей 3-нм заводов. TSMC это супер выгодно, потому что они в конце производственной цепочки и им нужна стабильность.
Nvidia тоже кайфует, продавая карты в 6 раз дороже себестоимости.
А гугл еще и своих мощностей Антропикам через GCP напродавал. Удивительная компания.
И чо?
Короче, индустрия не готова к росту от агентов. Потому что он случился слишком внезапно.
На рынке, где в конечном счёте важны долгосрочные контракты на сложную инфраструктуру для создания чипов.
У Антропиков сейчс есть 2.5 гигавата на вычисления и к концу года нужно 5-6. Столько можно получить только побираясь в категории Other. CoreWeave, Bedrock, Vertex, Foundry. С миру по нитке и за очень дорого. А они хотят стать прибыльной компанией и не могут позволить себе транжирить деньги.
Поэтому грустное.
Скорее всего страдать будем мы с вами.
Самое очевидное решение - они просто срежут лимиты и поднимут цены.
На днях они перевели OpenClaw на API. И так и написали, сорян ребята. Затягиваем пояса, вот вам 20 баксов в подарок за беспокойство.
А еще ввели разные тарифы в зависимости от времени суток. Я уже пару раз сталкивался с тем, что в "непиковые" часы Клод ложился под нагрузкой. Под наплывом бедняков за дешевыми токенами.

Я для себя два вывода сделал.
1 - Не класть все яйца в одну корзину.
Например, создавая скилл делать так, чтобы он работал на любой модели. Я тащусь от Клода, но OpenAI и Google в намного лучшем полжении в плане дступа к компьюту.
Поэтому я научился менять модель в зависимости от задачи. Плачу минимальную подписку каждой лабе. А когда заканчивается лимит - просто меняю нейронки.
Китайским опенсорсом пока не пользуюсь, потому что зачем. Не юзайте Дипсик, ради всего святого.
2 - Нервничать, что я не зарабатываю на ИИ.
Нейронки для меня это не способ зарабатывать больше денег.
Это моя статья расходов, которая себя окупает давая больше возможностей и времени.
Но вот если введут какой нибудь тир за 1000 баксов, я такое не потяну. Сейчас это абсурдно звучит. Но вспомните пример из первой части статьи с зарплатой реального человека. Пока 1000 баксов затрат приносит 5000 прибыли - это круто.
И те кто так делать не умеет, будет сидеть в бесплатном тарифе и смотреть рекламу =/
*Текст написан без нейросетей!
Если понравилось, жмакайте на подписку, чтобы я мог постить в пятницу вечером и не переживать что никто не прочитатет. *


Штош, я тут должен был появиться и дать никому не нужный комментарий длиной в половину поста с критикой и возможно собрать плюсы. :)
Я есть тот хер, что делает эту работу (писать и внедрять ассистентов) и прямо сейчас вижу только два варианта: бизнес не готов платить за замену, либо он уже это делал раньше.
Видение ситуации такое: большой бузинесс обесценивает ответственность решений кадров. Код писать адекватно могла еще первая чатгопота, обвязать агентами начинали примерно тогда же - получать пиздов за этот слоп при полной автоматизации будут не инженеры, а стейкхолдеры, а такого позволить они не могут, теряется смысл их работы. В итого - ассистент заебись, но заменять это те, кто вообще-то принимает решение, никогда не согласится, самураев почти нет.
С другой стороны, прототипирование и self-enterpreneurs получают тулу в руки для решения задачи "сократить время от идеи до теста рынком". Готов платить не бизнес короче, а очень любящая считать каждую копейку pro-sumer группа.
И безжалостно пиздят в отчетах. Они в минусах, нормальные плюсы - это если вычитать затраты на тренировки моделей. Что сюр. https://archive.is/pFT3i
Да, в ключевых репозиториях опенсорса из-за этого закрывали нахуй пулреквесты и bug bounty. Лайнус Торвальдс вовсе решил вопрос ребром соосно идее выше - ты постил слоп = тiкай з села, отвечать будешь конкретно ты. Из-за этого следующее:
Это увеличит стоимость специалиста, потому что теперь оператор ЛЛМ (бывший джун девелопер) не занимается копипастом стэка, он уже в цепочке принятий решений. Не самые важные, не обязательно знающий архитектуру, принципы разработки и подобный decision making, но вот и будет учиться, это и есть рост девелопера по грейду в 2к26м, это уже происходит.
Если бы в ресерч...
См. выше, у этих жуков планы в отчетах уже начинают жонглировать цифрами.
Ой блять, эти 600 миллиардов на инфраструктуру... Нет там 600 миллиардов, я бы насчитал от силы 150, что действительно завезли в инфраструктуру и чипы. Лучше бы не щемили CaHSR, деньги те же, пользы от дороги больше (эффект распределенного мегаполиса), и это помещения, подводки коммуникаций, NVIDIA по факту из-за заморозок строек даже перепроизвела чипов для этих датацентров.
Как там по байке идёт: порноиндустрия 20 лет осваивала инфраструктуру, проложенную во время бума доткомов. Только сейчас там приблизились к потреблению пропускной способности. В таком случае желательно американцам заранее разбираться с тем, что делать с пустыми складами, к которым подвели ебейшее электричество, источники воды и гигабитную оптику.
Читаем выше, экономика победит нездоровое стремление строить гиперскейлеров. Не является финансовым советом.
Читаем выше, добавим то, что как раз гугл в этом моменте даже в выигрыше, потому что когда не удовлетворят спрос на размещение, гугл останется при своих.
Бизнес не готов внедрять агенты as is, а вендоры ЛЛМок не готовы к OpEx от просьюмеров, читаем выше.
Наслаждаться просьюмерам надо, пока реальность не поставила планы на API не в 20/200 баксов, а в 100/1000. Потом придется считать деньги.
Спасибо на интересный пост, но я выражу мысль вертящуюся в голове уже больше 10 лет.
Я часто слышу фразу "Мир ьыл не готов к Х" (Мир не успевал за Х). У меня вопрос, скорее риторический. А к чему мир вообще был готов за последние 15 лет? :)
Напомнило анекдот
— Но доктор, моему сосед вот, например, тоже 83, а он рассказывает, что у них с женой секс каждый день.
— Голубчик, ну так и вы тоже рассказывайте!
Я не из IT, поэтому мое мнение - это просто мнение интересующегося юзера LLM и агентов в финансах.
Пока я вижу, что внедрение агентов не приводит к снижению хэдкаунт, потому что агенты не пролазят в требования по стабильности результата и точки ответственности. Вопрос простой, если что-то не так, то кого регулятор сажать/штрафовать будет?
К тому же легаси процессы и разрозненные системы в финансовой системе просто гигантские. Что тоже большое ограничение.
Я бы скорее предположил, что агенты постепенно снимут давление на текущих сотрудников и позволят делать вещи на более высоком уровне качества и делать вещи, на которые все до этого забивали.
Примерно как появление excel не привело к уменьшению количества аудиторов/фин аналитиков, а наоборот углубило сложность их - фин модели стали несравненно более моногфакторными, фин инструменты усложнились в попытке ближе отразить реальность и сделать адекватный прогноз, уловить более узкие ниши.
Это, конечно, произошло очень быстро. Наблюдал как коллеги, знакомые, друзья перешли на 90-100% кодинг с агентами буквально за 1-2 месяца.
Исключение, друзья в небольших компаниях в России, там где-то все как было в 24-25 годах и компании.
В этом году ждем, как потихоньку человек будет исключаться из цикла общения с агентом
Я не очень представляю, как AI-лабы будут выживать при цене подписки в условные 1к$/месяц. Сейчас это держится на том, что за дешево (240$-2400$ в год) ты получаешь лучшую модель с ограничениями (ограничения зависят от твоего пакета). При цене в 12к$ за год не вижу ни единой причины не купить макбук про/мак студио в хорошем конфиге сильно дешевле годовой подписки и гонять максимально доступную локальную модель (вот то Apple обрадуется). А, ну еще Nvidia со своими мини-пк для моделей (эти то в любом случае своего не упустят).
Супер-пост, классно, что рассказал про все слои инфраструктуры от разного железа до софт.
ЗЫ. Я работаю в Серебрасе и нам все эти вопросы актуальны)
Я скажу так, было уже много разных пузырей, те, кто в них участвовал тоже были не глупыми. понимали что это пузыри, страховались разными образами, но как мы знаем все заканчивалось плохо. Пузыри всегда лопались приводя к банкротствам и краху.
Для постоянного роста мощностей нужны полупроводники. Для полупроводников нужны редкоземельные металлы, а их очень мало в мире.
Если ИИ станет доступен для всех (как пишет автор подтянутся остальные), то крупные корпорации начнут терять бизнес, например: зачем владельцу пицерии подключаться к яндекс лавке, если он сам с помощью ИИ может сделать свое приложение. Или условно зачем такси подключаться к яндекс такси, если они могут сделать свой агрегатор. Крупные корпорации этого не допустят.
Экономические потрясения и другие инциденты связанные с ИИ. Стоит какой-то компании понести серьезные убытки, связанные с ИИ, весь пузырь может лопнуть, потому что инветоры не любят терять деньги. А чем масштабнее становятся замены - тем больше становится вероятность таких инцидентов. Если что-то подобное произойдет, компании начнут опять с жопой в мыле искать живых людей, чтобы переписать все, что нагенерировал ИИ и зарплаты пробьют все мыслимые и не мыслимые пределы.
К словам всяких Амодеев не стоит относиться серьезно. Помнится мне глава Николы тоже обещал что все будет супер, да и много других таких было. Их задача продать.
Лично мне кажется, что ИИ это тупиковая технология, которая уйдет от нас с большими потрясениями через пару лет и научит корпорации старой истине о том, что скупой платит дважды и попытки автоматизации за счет замены живых сотрудников не заканчиваются ничем хорошим.
Про зарабатывать.
На первый взгляд, зарабатывать надо на обучении, но это то что происходит везде и со всеми, только ленивый еще не сделал курс/лабу/чатик с целью если не просто "постоять со свечкой" рядом, то как минимум не проспать. Инфобиз моментально переоделся в ИИшников, они сидят на трендах, это понятно. Учить "в мутной воде", – кровавый океан. Было у Ильфа и Петрова, рыжая голова примелькалась и начали бить.
Если приглядеться, похоже что надо концентрировать экспертизу: делать быстрее – брать столько же, делать дешевле – брать столько же, желательно поверх богатого опыта. А освободившеся время тратить на самообучение, качать экспертизу, "окапываться". Только вот проблема, moat вероятно будет перепрыгнут следующей моделью. И копать придется вечно.