ИИ

Мир не успевает за AI лабами

Публичный пост

18 апреля 2026 3039

Leonid Khomenko

В конце прошлого года появилась новая тема для психоза вокруг нейосетей. На этот раз ей стали кодинг агенты.

AI лабы выпустили новые модели, поделали обновлений софта. И оно вдруг заработало на недоступном ранее уровне.

Люди говрят, что это новая эра в программировании и бла бла бла.

Но спустя несколько месяцев у нас есть не просто чьи то слова, а подтверждение в цифрах.

Агентские системы начали делать работу, за которую бизнес готов платить. Причем в таких масштабах, к которым не был готов никто.

Дальше расскажу про то, почему это уникальный момент в истории, почему к нему никто не готов и какие выводы я сделал для себя лично.

Про цифры

OpenAI и Anthropic возможно скоро решатся на IPO. И поэтому с большим энтузиазмом постят сколько они зарабатывают.

И это пиздец.
Это очень много денег.

Anthropic с начала года выросли в 3 раза. При том, что они уже большая компания. А чем ты больше, тем сложнее продолжать расти с прежней скоростью.

Слева OpenAI, справа Anthropic.

Даже когда складывались уникальные условия в прошлом, таких цифр не было ни у кого (с натяжкой, поясню ниже). Например, Zoom в пандемию, Google в момент их выхода на IPO, Coinbase когда они заработали на комиссиях на хайпе крипты. Это компании, которые в 5-10 раз меньше Anthropic, которые находились в особой ситуации и все равно росли медленнее.

Cобрал примеры самых удачных периодов роста компаний в их лучший год. Тут только те, кто уже стал крупным. Считал выручку на начало и конец года.

С натяжкой, потому что во первых были еще производители вакцины во время пандемии, а во вторых цифры Антропиков - это прогноз на остаток года по его началу. Но это кмк не особо важно и мои выводы не меняет:

1 - Бабки это крутой признак реального спроса на агентские системы.

Когда в прошлом году куча людей вдруг узнало, что ChatGPT умеет генерить классные картинки, к большим деньгам это не привело.

Сейчас же, только за один январь число коммитов от Claude Code на GitHub (в публично доступных репах) выросло с 2% до 4%. Если кажется мало, то учтите, что это всего за месяц и без учета Кодекса, Копайлота и Девина.
К концу года ребята прогнозируют что Клод дорастёт с 4% до 20%+.

Коммиты на Гитхабе от Клода.

Даже если подписка за 100$ может автоматизировать небольшую часть работы, это все равно не сравнится с зарплатой специалиста. Для медианной зарплаты в 350-500$ в день, ROI подписки для 10% самой простой и рутинной работы человека будет в 10-30 раз больше.

То есть - агенты доказали, что они могут делать ценную работу, за которую компании готовы платить. Это хайп, подкреплённый экономической ценностью, а не картинками для соцсетей.

И прикол в том, что мы только в начале пути. Спросу есть куда расти, тк агентами пользуются пока только самые шустрые. К ним потихньку подтянутся и все остальные.

И ...

2 - Индустрия к этому не готова.

Индустрия не готова к такому росту

Чтобы не говорить про абстрактную индустрию, поделю ее на 3 слоя.

ИИ лаборатории делают модели. OpenAI, Anthropic, DeepMind.
Гиперскейлеры строят датацентры. Google, Amazon, Microsoft, Meta.
Производители чипов производят чипы. Nvidia, TSMC, ASML.

И на всех слоях компании ссутся.

Люди в интернете любят поговорить про пузыри. Так вот все эти компании внезапно в курсе, что пузыри случаются. И чтобы не обанкротиться, каждый изобраетает свои способы.

Dario Amodei говорит, что планы компании он строит из негативного сценария по выручке. Забавно, что в этом году они его уже в полтора раза превышают. А от года всего 3 месяца прошло. Позитивный сценарий правда тоже превышают.

Дваркеш на интервью прямо спросил, как так. Ведь Дарио верит в невероятную пользу от ИИ в будущем. Пишет про это большие эссе, питчит про "страну гениев внутри датацентра". И при этом не хочет закладывать бабки по максимуму в это самое будущее.

Дарио говорит, что это опасно из за кассового разрыва в бизнес модели.

То есть, они предоставляют юзерам нейронки. Платят за инференс владешьцам железа и получают деньги с подписок и API. А параллельно с этим инвестируют бабки в ресерч на создание модели следующего поколения. Зарабатывать с которой начнут только через год или два.

Они регулярно тратят на ресерч больше половины.

Ты балансируешь не просто доходы с расходами, но еще и инвестиции в будущий рост. И если сильно вложился, а роста не случилось - у тебя огромные проблемы.

В таком режиме Антропики живут уже три года подряд. Каждый год растут в 10 раз. Дарио предполагал, что в 2026 это закончится. Ведь чем ты больше, тем сложнее.

Про что он в интерью не говорил, это про то, что их маржинальность растёт медленнее, чем должна по прогнозу. Расходы растут в разы быстрее того, что они закладывали в свои планы.

Дарио говорит, что он хочет вывести компанию в зону прибыльности через несколько лет. Для этого нужно улучшить маржинальность. То есть, замедлить рост и консервативно инвестировать деньги только на самые эффективные штуки.

Логика складная. А вот замедлиться чего то не выходит. Как будто они в этом году готовы снова в 10 раз вырасти. Но ресурсов под это не заложено.

Антропикам не хватает мощностей для такого количества пользователей.

Они арендуют видеокарты у гиперскейлеров. И не могут просто прийти в датацентр и попросить больше. Потому что у владельца датацентра тоже есть риск подорваться на пузыре. Поэтому все обьемы расписаны заранее.

Чтобы Anthropic смогли заработать $30B в год, кому то пришлось потратить $80B на инфстуктуру. С расчётом, что все это окупится за несколько лет.

Amazon в этом году потратит примерно $200B, Google $180B, Meta $125B, Microsoft $105B. Это задел на триллионы экономической ценности в ближайшие годы.

И риск кассового разрыва, если ценности не случится.

Индустрия - это длиннющая цепочка создания ценности. И каждый в ней старается снизить для себя риски, фиксируя ожидания в контрактах. Что снижает способность всей цепочки реагировать на неожиданности. Такие как, например, рост популярности агентов.

Это приводит к тому, что каждый год лабортории ограничены чем то новым. И ограничения потихоньку сьезжают к тем, кто дальше в цепочке от конечного юзера. Потому что их риски больше, а контракты еще менее гибкие.

Ограничения постоянно разные

В 2023 все гонялись за видеокартами. А точнее у заводов TSMC не хватало мощностей для финальной сборки чипов в модули (CoWoS).
В 2024 случился дефицит HBM памяти для тех же модулей.
В 2025 с картами стало лучше, но для датацентров начало не хватать энергии.
В 2026 стало понятно, что даже если энергия есть, электрическая сеть США не может ее доставлять в нужных обьемах до датацентров.

Дальше подробнее.

1 - Память

Свременным моделям память нужна больше, чем раньше.
Я выше писал, что компании тратят сотни миллиардов в год на инфраструктуру. По прикидкам примерно 30% из них - это на память.

Причем им приходится закупать дорогую HBM вместо дешевой DDR. Потому что высокая пропускная способность помогает видеокартам не простаивать пока память обрабатывает свою часть. Дорогая память не такая уж и дорогая в сравнении с полной стоимостью видеокарты.

Оказывается память это самое дорогое что есть в карте. Если не считать наценку =)

Скорее всего цены на память будут расти, если не придумают как это обходить. Могут спокойно еще в 2-3 раза вырасти, потому что SK Hynix и Samsung контролируют 90% рынка. А спрос на память только растёт.

2 - Энергия и датацентры

xAI показали, что датацентры можно строить довольно быстро.

Но большая инфраструктура не выдерживает, когда в каком нибудь регионе за полгода появляется штука жрущая электричество как небольшой город. Я уже привык к новостям, что технологические компании начали закупать старые электростанции.

Удивительно, что челик из Semianalysis за энергию особо не беспокоится. Новые электростанции, трансформаторные и банально вышки для проводов строить долго. Но пока электическая сеть адаптируется к новой нагрузке, питать датацентры можно от промышленных турбин на газу. Буквально подвозишь к датацентру десяток трейлеров с генераторами и всё.

Еще есть всякие поршневые двигатели, солнечные панели и батареи, химические реакторы на водороде, судовые двигаетли... Короче, что только не придумали за время существвни топливной индустрии. И в совокупности вместе с эффективным использованием электросети это может дать сотни гигаватт мощностей.

Сейчас одни только видеокарты расходуют 13ГВ, если добавить мощности всего датацентра, можно на 2 умножать

Чтобы строить дата-центры и реакторы быстро, не хватает квалифицированной рабочей силы и банально электриков.

Дорого и трудоёмко, но оказывается все еще проще, чем цепочка поставок полупродневников.

3 - Производство полупроводников

Есть заводы (в основном TSMC), собирающие видеокарты определённой эры (по чертежам Nvidia или Google). Напрмер, по 3-нанометровому процессу.

Ну и просто не построено достаточно заводов.

Быстро это не исправить, потому что это одни из самых сложных промышленных объектов на планете. Чтобы такой построить, нужно 2-3 года и куча специализированного оборудования и химических штук.

Самое сложное - это литографические машины (EUV scanner). Они нужны, чтобы отливать чипы на вафельницах. Которые потом соединяют в модули с памятью и получаются видеокарты.

Так вот эти машины стоят ~$350M за штуку. Делает такие только одна компания из Нидерландов - ASML. Где то по 50 машин в год.

Можно прикинуть, что к 2030 году в мире их будет в ~700. Это порядка 200 гигават вычислений на всех.
На конец 2025 мы тратили ~27 гигават. Это до бума агентов.

Короче, расти есть куда, но будет постоянный дефицит, ограниченный строительством заводов, ограниченный памятью и вафельницами, ограниченный машинами для литографии.

То есть это такие ограничения, которые нельзя залить деньгами в отличие от памяти и энергии для датацентров.

Это хорошо видно на поведении Google.

У них есть свой дизайн чипов. И при этом они четверть чипов закупают у Nvidia. Они бы с кайфом свои делали, вот только не могут.

Доля снижается, но это все равно много

Все чипы собирают заводы TSMC по чужим чертежам. А Google и Amazon (у них тоже есть свой дизайн) проспали момент когда Jensen Huang назаключал контрактов на производство аж на 70% мощностей 3-нм заводов. TSMC это супер выгодно, потому что они в конце производственной цепочки и им нужна стабильность.

Nvidia тоже кайфует, продавая карты в 6 раз дороже себестоимости.

А гугл еще и своих мощностей Антропикам через GCP напродавал. Удивительная компания.

И чо?

Короче, индустрия не готова к росту от агентов. Потому что он случился слишком внезапно.

На рынке, где в конечном счёте важны долгосрочные контракты на сложную инфраструктуру для создания чипов.

У Антропиков сейчс есть 2.5 гигавата на вычисления и к концу года нужно 5-6. Столько можно получить только побираясь в категории Other. CoreWeave, Bedrock, Vertex, Foundry. С миру по нитке и за очень дорого. А они хотят стать прибыльной компанией и не могут позволить себе транжирить деньги.

Поэтому грустное.

Скорее всего страдать будем мы с вами.

Самое очевидное решение - они просто срежут лимиты и поднимут цены.

На днях они перевели OpenClaw на API. И так и написали, сорян ребята. Затягиваем пояса, вот вам 20 баксов в подарок за беспокойство.

А еще ввели разные тарифы в зависимости от времени суток. Я уже пару раз сталкивался с тем, что в "непиковые" часы Клод ложился под нагрузкой. Под наплывом бедняков за дешевыми токенами.

Я для себя два вывода сделал.

1 - Не класть все яйца в одну корзину.

Например, создавая скилл делать так, чтобы он работал на любой модели. Я тащусь от Клода, но OpenAI и Google в намного лучшем полжении в плане дступа к компьюту.

Поэтому я научился менять модель в зависимости от задачи. Плачу минимальную подписку каждой лабе. А когда заканчивается лимит - просто меняю нейронки.

Китайским опенсорсом пока не пользуюсь, потому что зачем. Не юзайте Дипсик, ради всего святого.

2 - Нервничать, что я не зарабатываю на ИИ.

Нейронки для меня это не способ зарабатывать больше денег.
Это моя статья расходов, которая себя окупает давая больше возможностей и времени.

Но вот если введут какой нибудь тир за 1000 баксов, я такое не потяну. Сейчас это абсурдно звучит. Но вспомните пример из первой части статьи с зарплатой реального человека. Пока 1000 баксов затрат приносит 5000 прибыли - это круто.

И те кто так делать не умеет, будет сидеть в бесплатном тарифе и смотреть рекламу =/

*Текст написан без нейросетей!

Если понравилось, жмакайте на подписку, чтобы я мог постить в пятницу вечером и не переживать что никто не прочитатет. *

Связанные посты

Grok 3 — ИИ от Илона Маска, 2 месяца спустя

76 комментариев 👇

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Данил Бирюков-Романов Slackware engineer 18 апреля в 06:23

Спасибо на интересный пост, но я выражу мысль вертящуюся в голове уже больше 10 лет.

Я часто слышу фразу "Мир ьыл не готов к Х" (Мир не успевал за Х). У меня вопрос, скорее риторический. А к чему мир вообще был готов за последние 15 лет? :)

Развернуть 1 комментарий

Дима Раевский 18 апреля в 09:55

Очень странно после десятков хайп-циклов по разным технологиям не ожидать очередного.
Очень странно удивляться тому, что количественный прогноз не совпал с реальным положением дел, учитывая известный факт того, насколько мы плохи в прогнозировании.

Хуман такой хуман.

Развернуть 1 комментарий

Leonid Khomenko 18 апреля в 11:48 автор

@mammuthus,
@urtow,

Да разные ситуации в истории были

Костя вот доткомы упомянул. Телеком в какой то момент понастроил инфраструктуры в 50 раз больше чем нужно

Еще были ядерные реакторы в конце 70 когда спрос не успевал за строительством

3G/4G каждый раз были построены до массового распространения основного юзкейса мобилок разного поколения. Но тут уже строительство сбалансировано было.

Сеть зарядок для EV тоже вполне адекватно будущему спросу строилась, но заранее.

Развернуть 1 комментарий

Константин Бузановский 18 апреля в 10:55

@urtow, я думаю, что он был готов к вебдванолю. После разрыва петли доткомов, народ что шарил, понимал, что инфры и пропускной способности канала сети был неимоверный, из-за чего можно было класть на оптимизацию, грести бабки лопатой, ну и данные, конечно.

По факту это можно метафорически сравнить с тем, что сожгли огромный молодой лес, который осваивать нужно было десятки лет и почвы были всегда плодородные и поебать на результаты и последствия. И пока до сих пор их нет.

Развернуть 1 комментарий

Юрий Федосеев делаю clickhouse 18 апреля в 07:05

Это, конечно, произошло очень быстро. Наблюдал как коллеги, знакомые, друзья перешли на 90-100% кодинг с агентами буквально за 1-2 месяца.

Исключение, друзья в небольших компаниях в России, там где-то все как было в 24-25 годах и компании.

В этом году ждем, как потихоньку человек будет исключаться из цикла общения с агентом

Развернуть 1 комментарий

Константин Бузановский Душная Машина 18 апреля в 09:44

Штош, я тут должен был появиться и дать никому не нужный комментарий длиной в половину поста с критикой и возможно собрать плюсы. :)

Агентские системы начали делать работу, за которую бизнес готов платить.

Я есть тот хер, что делает эту работу (писать и внедрять ассистентов) и прямо сейчас вижу только два варианта: бизнес не готов платить за замену, либо он уже это делал раньше.

Видение ситуации такое: большой бузинесс обесценивает ответственность решений кадров. Код писать адекватно могла еще первая чатгопота, обвязать агентами начинали примерно тогда же - получать пиздов за этот слоп при полной автоматизации будут не инженеры, а стейкхолдеры, а такого позволить они не могут, теряется смысл их работы. В итого - ассистент заебись, но заменять это те, кто вообще-то принимает решение, никогда не согласится, самураев почти нет.

С другой стороны, прототипирование и self-enterpreneurs получают тулу в руки для решения задачи "сократить время от идеи до теста рынком". Готов платить не бизнес короче, а очень любящая считать каждую копейку pro-sumer группа.

OpenAI и Anthropic возможно скоро решатся на IPO. И поэтому с большим энтузиазмом постят сколько они зарабатывают.

И безжалостно пиздят в отчетах. Они в минусах, нормальные плюсы - это если вычитать затраты на тренировки моделей. Что сюр. https://archive.is/pFT3i

Сейчас же, только за один январь число коммитов от Claude Code на GitHub (в публично доступных репах) выросло с 2% до 4%. Если кажется мало, то учтите, что это всего за месяц и без учета Кодекса, Копайлота и Девина.

Да, в ключевых репозиториях опенсорса из-за этого закрывали нахуй пулреквесты и bug bounty. Лайнус Торвальдс вовсе решил вопрос ребром соосно идее выше - ты постил слоп = тiкай з села, отвечать будешь конкретно ты. Из-за этого следующее:

Даже если подписка за 100$ может автоматизировать небольшую часть работы, это все равно не сравнится с зарплатой специалиста. Для медианной зарплаты в 350-500$ в день, ROI подписки для 10% самой простой и рутинной работы человека будет в 10-30 раз больше.

Это увеличит стоимость специалиста, потому что теперь оператор ЛЛМ (бывший джун девелопер) не занимается копипастом стэка, он уже в цепочке принятий решений. Не самые важные, не обязательно знающий архитектуру, принципы разработки и подобный decision making, но вот и будет учиться, это и есть рост девелопера по грейду в 2к26м, это уже происходит.

То есть, они предоставляют юзерам нейронки. Платят за инференс владешьцам железа и получают деньги с подписок и API. А параллельно с этим инвестируют бабки в ресерч на создание модели следующего поколения. Зарабатывать с которой начнут только через год или два.

Если бы в ресерч...

Дарио говорит, что он хочет вывести компанию в зону прибыльности через несколько лет.

См. выше, у этих жуков планы в отчетах уже начинают жонглировать цифрами.

Чтобы Anthropic смогли заработать $30B в год, кому то пришлось потратить $80B на инфстуктуру. С расчётом, что все это окупится за несколько лет.
Amazon в этом году потратит примерно $200B, Google $180B, Meta $125B, Microsoft $105B. Это задел на триллионы экономической ценности в ближайшие годы.

Ой блять, эти 600 миллиардов на инфраструктуру... Нет там 600 миллиардов, я бы насчитал от силы 150, что действительно завезли в инфраструктуру и чипы. Лучше бы не щемили CaHSR, деньги те же, пользы от дороги больше (эффект распределенного мегаполиса), и это помещения, подводки коммуникаций, NVIDIA по факту из-за заморозок строек даже перепроизвела чипов для этих датацентров.

Как там по байке идёт: порноиндустрия 20 лет осваивала инфраструктуру, проложенную во время бума доткомов. Только сейчас там приблизились к потреблению пропускной способности. В таком случае желательно американцам заранее разбираться с тем, что делать с пустыми складами, к которым подвели ебейшее электричество, источники воды и гигабитную оптику.

Память
Энергия и датацентры

Читаем выше, экономика победит нездоровое стремление строить гиперскейлеров. Не является финансовым советом.

Производство полупроводников

Читаем выше, добавим то, что как раз гугл в этом моменте даже в выигрыше, потому что когда не удовлетворят спрос на размещение, гугл останется при своих.

Короче, индустрия не готова к росту от агентов. Потому что он случился слишком внезапно.

Бизнес не готов внедрять агенты as is, а вендоры ЛЛМок не готовы к OpEx от просьюмеров, читаем выше.

Скорее всего страдать будем мы с вами.

Наслаждаться просьюмерам надо, пока реальность не поставила планы на API не в 20/200 баксов, а в 100/1000. Потом придется считать деньги.

Развернуть 1 комментарий

Марсель Валеев 18 апреля в 10:15

@mighty_conrad, всегда в таких постах, в комментариях ищу твой) очень интересно читать. Не потому что я согласен или не согласен, а потому что выдаешь интересные аргументы и размышления, о которых я мог не подумать/не знать. И в целом системная и аргументированная точка зрения это довольно полезно для апдейта своей картины мира

Развернуть 1 комментарий

Константин Бузановский 18 апреля в 10:41

@vmarcel, мучес грасиес. :)

На самом деле, эти комментарии - результат профдеформации, то есть результат больного и неловкого опыта работы, там можно и нужно находить ошибки рассуждений, вообще поэтому я и пишу их. Не хочу претендовать на истину в последней инстанции, но хочу абузить закон Стивенсона, когда пишешь любую поебень, а в комментарии приходят дядечки что шарят и поясняют где неправ.

Развернуть 1 комментарий

Leonid Khomenko 18 апреля в 10:35 автор

@mighty_conrad,

Код писать адекватно могла еще первая чатгопота, обвязать агентами начинали примерно тогда же

ээээ, ты действительно так считаешь?

Развернуть 1 комментарий

Константин Бузановский 18 апреля в 10:37

@leeaao, я так отгружал проекты ещё в 2023м, когда сталкивался с техстэком, который я вообще не знал и нужно было изучать его на коленке. С тех пор тошнит от OpenCV и FreeCAD. Не написать гопоте "давай ебать погромировай", а "вот задача, херачь код". Обвязки тогда еще не знал для этого.

Развернуть 1 комментарий

Leonid Khomenko 18 апреля в 10:44 автор

@mighty_conrad, ну то есть ты считаешь, что современные модели не показывают качественно другой уровень?
В умении долго следовать инструкциям, самим искать нужные тулы, проверять качество результата после своей работы?

Кажется именно это даёт возможность делегировать нейронке все более сложные задачи и не получать пизды потом

Развернуть 1 комментарий

Константин Бузановский 18 апреля в 10:50

@leeaao, Gemini до сих пор пиздаболит (казалось бы, где обвязка с поиском лучшая должна быть), GPT скатывается в желание делать саммари, а не отвечать на контекст, агентский стэк внутри проектов Клода вечно роняет файлы. У меня по очереди до 3 подписок, это личный опыт всё.

Если модели и стали лучше, harness пока по вайбам недорос, чтобы любой долбан моего уровня дал задачу и пришел смотреть результат. В принципе, неудивительно, что самые популярные harness используют защитные промпты, сильное разделение ролей, планировщик иногда вовсе исчезает, механизмы памяти в том же клодкоде вообще трех-ступенчатые, ибо иначе без колхоза нормально не работает (хотя, на колхоз-решениях работает всё, это не минус даже).

Развернуть 1 комментарий

Дмитрий Кудрявцев 21 апреля в 15:14

@leeaao, у нас на проекте нейронка так 20 ненужных библиотек подключила, хотя ее никто не просил.

Развернуть 1 комментарий

Leonid Khomenko 21 апреля в 15:26 автор

@splcell, ну подчистили бы garbage-коллеетором раз ненужные, делов то

Развернуть 1 комментарий

Vasily Krouglov 18 апреля в 23:39

@mighty_conrad, люто плюсую коммент, только со своей колокольни скорректировал бы один момент: бизнес не так уж рьяно хочет платить за это (особенно вне кодинга) не потому, что кому-то (кто этого не хочет) надо взять ответственность за слоп, а потому что LLM-тулы, хоть усрись со всеми настройками-обвязками-гиперпромптами-мегаскиллами-гигаMCP-ебать-там-чё-угодно-ещё, ультимативно ненадёжный инструмент (результат всегда непредсказуем и никогда не гарантирован) с непрозрачными непрогнозируемыми затратами (сколько триллионов токенов — или всего пять тыщ? — уйдёт чтобы выполнить простейший таск? you never know) и минимально применимый вне кодинга/суммаризации (при всём хайпе про «агентов», «широкое внедрение во все сферы», «AI всех заменит» и прочем маркетинговом буллшите ослеплённых сиянием пузыря фанатиков для аналогично легковерных дурачков, LLM по факту могут только суммаризовать, выплёвывать код, +- анализировать естественный язык и выдавать какие-то [посредственные] тексты; они не думают, они не субъектны, они не агентны))).

И в итоге получается, что платить за это бизнесу разного масштаба интересно и выгодно либо в очень узких кейсах, где LLM реально хорошо применимы (я лично знаю такие на опыте), либо когда ты платишь $100-$200 за подписку, в которой ты можешь выжимать кучу итераций, анализа и подсказок как solopreneur. И это всё до тех пор, пока цена не скакнула х10 либо OpenAI и Anthropic не обанкротились после того, как заёмные деньги подорожали, а инвесторы охладели (или сначала одно, потом другое).

Развернуть 1 комментарий

Vasily Krouglov 18 апреля в 23:49

@colroyce, PS: я ещё не прочитал сам пост целиком, но ёлки-палки, какие вообще «агентские системы»… нет никаких агентских систем, есть набор криво работающих костылей, вокруг которого люто усираются адепты, вливающие в настройку того, чтобы этот набор хоть как-то работал для выполнения тупейших задач, сотни часов, чтобы получать невнятные результаты с перманентным риском, ранжирующимся от оплошности до тотального кластерфака.

В 99% случаев эти «агентские системы» или решают задачи, которые вообще не нужно было решать (зато «лол глядите, у меня ии делает хрень за меня»), или решают что-то актуальное, но херово — так, что проще и дешевле было бы сделать это вручную, или написать скриптов, или написать полноценный софт. В итоге — просто шизануто неэффективный перевод ресурсов, чтобы потешить своё/стейкхолдеров эго или почувствовать общность за счёт «все побежали, и я побежал».

Развернуть 1 комментарий

Leonid Khomenko 20 апреля в 10:44 автор

@colroyce, в англоязычном мире Claude code и Codex называют coding agents или agentic systems

Развернуть 1 комментарий

Vasily Krouglov 22 апреля в 10:26

@leeaao, да я прекрасно понимаю, но я же не про то, как их называют, а про то, чем они являются или не являются. Велосипед тоже можно называть каравеллой, но по морю он от этого не поплывёт.

Весь нейминг вокруг LLM очень marketing-based (или hype-based, если хочешь) и продаёт то, чем LLM [на текущий момент или в принципе технически никогда] не являются. Начиная с того, что это не artificial intelligence (что не мешает всем по стандарту называть это AI), продолжая «агентами», и дальше по списку.

Развернуть 1 комментарий

Leonid Khomenko 22 апреля в 13:39 автор

@colroyce, а думаешь это важно вообще?

Клод Код достаточно сильно отличается от стандартного интерфейса в вебе, чтобы дать ему и похожим на него штукам имя.

Чуваки из Антропик выбрали имя задолго до публичного релиза. И думаю не из за маркетинга, а потому что просто они программисты которые пишут код и делали тут в первую очередь для себя.

Ну мб я соглашусь, что название не идеально отражает суть. Но какая разница? Про эту тему даже сериал сняли (рыцарь семи королевств).

Типа не важно как называется, важна суть

Развернуть 1 комментарий

Sergei Mikhailov 22 апреля в 14:05

@colroyce,

бизнес не так уж рьяно хочет платить за это

я не то, чтобы наблюдаю много разных бизнесов чтобы обобщать, но то что я вижу - разумный бизнес очень-очень хочет платить за это.

и у этого есть очень простая логика. представим ты сео-сто. и впереди маячит штука, которая

уже сейчас увеличивает продуктивность даже простого клерка ну пусть на 5-10%
возможно что завтра увеличит на 20-30
есть ненулевой, достаточно высокий шанс, что послезавтра заменит половину людей.
а еще есть маленький шансик, что через 3 дня ты проиграешь конкуренту, который вложился, внедрил и побежал "пилить фичи" быстрее тебя.

в таких условиях не вложиться это сильный(нет) шаг.

Развернуть 1 комментарий

Vasily Krouglov 22 апреля в 21:33

@leeaao,

Типа не важно как называется, важна суть

Так я об этом же и говорю :)

Развернуть 1 комментарий

Vasily Krouglov 22 апреля в 21:47

@underlow, ну в частностях бывает по-всякому, я не спорю, но глобально если бы бизнес очень-очень хотел платить на самом деле, то у двух основных вендоров явно не были бы такие смехотворные выручки (про которые они ещё и, я абсолютно уверен, припёздывают — у них собственные отрапортованные цифры не сходятся друг между другом, а также очень большие вопросы к тому, как они это всё, мягко говоря, нестандартно считают). И ведь я ж даже не про прибыль (которая заведомо отрицательная и вообще другой вопрос). Сколько там действительно без их приукрашивания выручки, точно сказать невозможно (они ж по-настоящему не отчитываются, кроме одного дока от Anthropic под присягой в судебном процессе), но если кто-то из них соберётся на IPO, узнаем — и, возможно, им на IPO будет очень больно :)

И причём вот эти оценочные выручки не гигантские даже с учётом того, что в них входят выкупленные FAANG (который в провайдеров же и вложился) объёмы, плюс купленные реселлерами объёмы (типа всяких Cursor). Ну то есть если бизнес так невероятно хочет платить, где деньги-то?

Развернуть 1 комментарий

Sergei Mikhailov 22 апреля в 21:59

@colroyce,

так миллион причин. но главная, предположу, в том, что даже тут, где большинство людей так или иначе неглупые инженеры, так вот даже тут огромное количество людей считает что это пузырь, баловство и "не может предсказалка токенов думать и быть полезной"
ну то есть люди готовые буквально месяцами настраивать вим, чтобы получить две минуты выгоды в написании кода отказывают в пользе штуке, которая за них код пишет.
а уж в бизнесе...

а еще мне очень понравилось, как ты круто делаешь выводы из оценки "пальцем в небо", ну типа берем неизвестные числа, оцениваем категорией гиганские/не гиганские и делаем вывод, что бизнес платить не хочет. круто :)

Развернуть 1 комментарий

Vasily Krouglov 22 апреля в 22:06

@underlow, Почему неизвестные, я про публичные заявления Альтмана и Амодея + стейтмент CFO Anthropic в суде, где она дала показания, что компания за всё время существования заработала $5 млрд + репортинг медиа на основе источников в компаниях

Развернуть 1 комментарий

Vasily Krouglov 22 апреля в 22:15

@underlow,

даже тут огромное количество людей считает что это пузырь, баловство и "не может предсказалка токенов думать и быть полезной"

а также не знаю насчёт других здесь, не уверен включаешь ты меня в это число или нет, но у меня чёткая позиция и она везде во всех комментариях по теме проходит сквозной чертой: LLM — не баловство и не пузырь, это реальный инструмент, полезный в своих конкретных применениях.

Баловство и пузырь — это как раз попытка притянуть LLM к любой всратой задаче независимо от того, насколько инструмент в ней реально полезен и к ней применим, пытаются ли в этом случае микроскопом гвозди забивать, или через молоток в чашку Петри смотреть. Не в инструменте проблема, как обычно.

Развернуть 1 комментарий

Sergei Mikhailov 22 апреля в 22:33

@colroyce, не включаю никого конкретного. просто каждый раз когда слышу подобные мнения очень хочу узнать, а что же за этим стоит.

это как раз попытка притянуть LLM к любой всратой задаче

с одной стороны с этим я согласен. сам наблюдал прекрасные истории, когда людей заставляли воткнуть ллм туда где ну вообще никак. в стиле, а давайте заменим калькулятор ллмкой.

с другой, а как еще внедрять? берем молоток к которому еще не изобрели подходящих гвоздей, прикладываем ко всему до чего можем дотянуться, смотрим где сработало.

Развернуть 1 комментарий

Vasily Krouglov 22 апреля в 23:28

@underlow, Согласен, что trial and error — норм тема. Один из базовых научных методов. Не единственный, правда, но ладно.

Просто когда я отсылаю к тому, что происходит в медиапространстве (и в практике очень многих [sic! не всех] людей, которые в этом медиапространстве радостно публично
делятся своим опытом), я имею в виду как раз проповедование LLM как универсального уравнителя единого инструмента, который решит все проблемы вообще у всех и во всех сферах, по вкусу для эффекта можно добавить, что навсегда. И, как уже говорил выше, также приписывание ему каких-то способностей или характеристик, которых у него нет — некоторые в текущий момент ещё не появились и не работают, других никогда и не может быть.

И у этих людей это обычно не trial and error, а fuck around and find out.

За тех, кто понимает, как инструмент вообще работает, ставит и проверяет гипотезы, корректирует их в зависимости от результатов, и в итоге находит валидное применение, я только искренне радуюсь, правда :) в текущих условиях, к сожалению, их меньшинство

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Evgeniy Petukhov Фулл-стек TypeScript разработчик 18 апреля в 12:59

Напомнило анекдот

— Но доктор, моему сосед вот, например, тоже 83, а он рассказывает, что у них с женой секс каждый день.
— Голубчик, ну так и вы тоже рассказывайте!

Развернуть 1 комментарий

Константин Харитонов Выбиваю долги с помощью Java 18 апреля в 14:09

Я не очень представляю, как AI-лабы будут выживать при цене подписки в условные 1к$/месяц. Сейчас это держится на том, что за дешево (240$-2400$ в год) ты получаешь лучшую модель с ограничениями (ограничения зависят от твоего пакета). При цене в 12к$ за год не вижу ни единой причины не купить макбук про/мак студио в хорошем конфиге сильно дешевле годовой подписки и гонять максимально доступную локальную модель (вот то Apple обрадуется). А, ну еще Nvidia со своими мини-пк для моделей (эти то в любом случае своего не упустят).

Развернуть 1 комментарий

Leonid Khomenko 18 апреля в 14:23 автор

@drkswg,
Как варианты:
вендорлок / продуктовые фичи экосистемы
корп. подписки
сильное отставание локальных моделей / сложность настройки

Развернуть 1 комментарий

Dmitry Bogomolov 18 апреля в 14:33

@drkswg, это если за модель платит физик, а не компания. Если в b2b сегменте подсадят, то 1к за место будут платить, если модели станут ещё качественнее от текущих.

Если платили более высокие ЗП разработчикам, и оно условно даст 50% эффективности сверху 2 разрабам, то экономика сходится доплатить, а не нанимать третьего.

Третий будет и ЗП выше просить, и в отпуска с больничными уходить.

Развернуть 1 комментарий

Gleb Kudriavtcev 18 апреля в 15:27

@drkswg, самая лучшая локальная модель сейчас все равно сильно отстает от сота

Развернуть 1 комментарий

Константин Харитонов 18 апреля в 18:19

@glebkudr, и будет отставать в будущем, тут вопросов нет. Вопрос в том, на сколько этот разрыв в "производительности" будет критичен по сравнению с разницей в стоимости.

Развернуть 1 комментарий

Leonid Khomenko 18 апреля в 19:27 автор

@drkswg, синьорам компании готовы платить в разы больше, чем джунам.
Потому что они не ебут мозги и деливерят результат.

Развернуть 1 комментарий

Константин Харитонов 19 апреля в 09:14

@leeaao, не совсем понял, к чему это. Я про разницу в производительности и стоимости локальной модели и условного GPT по подписке, а не про разрабов разных грейдов.

Развернуть 1 комментарий

Leonid Khomenko 19 апреля в 09:30 автор

@drkswg, я думаю между моделями такая же разница будет держаться. Дешёвой моделью дешевле пользоваться по деньгам, но команде придётся тратить на нее больше своего времени

Развернуть 1 комментарий

Igor Martynov Продакт, который умеет руками 18 апреля в 19:28

Про зарабатывать.

На первый взгляд, зарабатывать надо на обучении, но это то что происходит везде и со всеми, только ленивый еще не сделал курс/лабу/чатик с целью если не просто "постоять со свечкой" рядом, то как минимум не проспать. Инфобиз моментально переоделся в ИИшников, они сидят на трендах, это понятно. Учить "в мутной воде", – кровавый океан. Было у Ильфа и Петрова, рыжая голова примелькалась и начали бить.

Если приглядеться, похоже что надо концентрировать экспертизу: делать быстрее – брать столько же, делать дешевле – брать столько же, желательно поверх богатого опыта. А освободившеся время тратить на самообучение, качать экспертизу, "окапываться". Только вот проблема, moat вероятно будет перепрыгнут следующей моделью. И копать придется вечно.

Развернуть 1 комментарий

Leonid Khomenko 18 апреля в 19:46 автор

@igormartynov, последние месяцы впечатляют посты от антропиков как они работают вместе.

Пока я что то ковыряю у себя на компе, собираю крохи информации по чатикам. Там команда из задротов где каждый по десятку раз каждый день контрибьютит в общий Claude.md

Я думаю персональный moat в том, чтобы не учиться одному

Развернуть 1 комментарий

Igor Martynov 18 апреля в 20:22

@leeaao, давай придумаем этому название :)

Если ноосфера - сфера человеческого разума, охватывающая планету, то это - ноомёрдж? Or conoesis?

Развернуть 1 комментарий

Leonid Khomenko 19 апреля в 08:01 автор

@igormartynov, ноосфера отлично подходит

Развернуть 1 комментарий

Зигфрид Звездин ML Solutions Architect 18 апреля в 21:18

Супер-пост, классно, что рассказал про все слои инфраструктуры от разного железа до софт.
ЗЫ. Я работаю в Серебрасе и нам все эти вопросы актуальны)

Развернуть 1 комментарий

Кирилл Жухарев 21 апреля в 16:12

@Zigger, вы кодинг планы не планируете возвращать?)

Развернуть 1 комментарий

Зигфрид Звездин 21 апреля в 18:56

@zhu, I wouldn’t count on that)

Развернуть 1 комментарий

Alexey Kobylyanskiy Credit risks, private debt, infra finance 21 апреля в 09:38

Я не из IT, поэтому мое мнение - это просто мнение интересующегося юзера LLM и агентов в финансах.

Пока я вижу, что внедрение агентов не приводит к снижению хэдкаунт, потому что агенты не пролазят в требования по стабильности результата и точки ответственности. Вопрос простой, если что-то не так, то кого регулятор сажать/штрафовать будет?

К тому же легаси процессы и разрозненные системы в финансовой системе просто гигантские. Что тоже большое ограничение.

Я бы скорее предположил, что агенты постепенно снимут давление на текущих сотрудников и позволят делать вещи на более высоком уровне качества и делать вещи, на которые все до этого забивали.

Примерно как появление excel не привело к уменьшению количества аудиторов/фин аналитиков, а наоборот углубило сложность их - фин модели стали несравненно более моногфакторными, фин инструменты усложнились в попытке ближе отразить реальность и сделать адекватный прогноз, уловить более узкие ниши.

Развернуть 1 комментарий

Дмитрий Кудрявцев Frontend-разработчик 21 апреля в 15:06

Я скажу так, было уже много разных пузырей, те, кто в них участвовал тоже были не глупыми. понимали что это пузыри, страховались разными образами, но как мы знаем все заканчивалось плохо. Пузыри всегда лопались приводя к банкротствам и краху.

По ситуации с ИИ - это явный пузырь и крупные компании вынуждены участвовать в гонке чтобы не отстать от конкурентов. Но...какой бы прорывной ни казалась технология, это не значит, что она не окажется тупиковой. И вот как я вижу возможные варианты развития событий:

Для постоянного роста мощностей нужны полупроводники. Для полупроводников нужны редкоземельные металлы, а их очень мало в мире.
Если ИИ станет доступен для всех (как пишет автор подтянутся остальные), то крупные корпорации начнут терять бизнес, например: зачем владельцу пицерии подключаться к яндекс лавке, если он сам с помощью ИИ может сделать свое приложение. Или условно зачем такси подключаться к яндекс такси, если они могут сделать свой агрегатор. Крупные корпорации этого не допустят.
Экономические потрясения и другие инциденты связанные с ИИ. Стоит какой-то компании понести серьезные убытки, связанные с ИИ, весь пузырь может лопнуть, потому что инветоры не любят терять деньги. А чем масштабнее становятся замены - тем больше становится вероятность таких инцидентов. Если что-то подобное произойдет, компании начнут опять с жопой в мыле искать живых людей, чтобы переписать все, что нагенерировал ИИ и зарплаты пробьют все мыслимые и не мыслимые пределы.

К словам всяких Амодеев не стоит относиться серьезно. Помнится мне глава Николы тоже обещал что все будет супер, да и много других таких было. Их задача продать.

Лично мне кажется, что ИИ это тупиковая технология, которая уйдет от нас с большими потрясениями через пару лет и научит корпорации старой истине о том, что скупой платит дважды и попытки автоматизации за счет замены живых сотрудников не заканчиваются ничем хорошим.

Развернуть 1 комментарий

🕵️ Юзер скрыл свои комментарии от публичного просмотра...

Leonid Khomenko 21 апреля в 15:32 автор

@splcell,

Лично мне кажется, что ИИ это тупиковая технология, которая уйдет от нас с большими потрясениями через пару лет

Обоснуешь, почему?

Развернуть 1 комментарий

Дмитрий Кудрявцев 21 апреля в 15:34

@leeaao, В своем комменте недостаточно обосновал? Слишком много неизвестных и рисков для получения сомнительной бизнес-ценности. Может на коротком горизонте она и не кажется сомнительной, но на длинном да

Развернуть 1 комментарий

Leonid Khomenko 21 апреля в 15:42 автор

@splcell, честно, я твой коммент не понял совсем. Там что то оч много всего в кучу намешано. Интересно, почему ты думаешь, что много неизвестных рисков которые в итоге приведут к тому что технология ии от нас уйдёт

Развернуть 1 комментарий

Дмитрий Кудрявцев 21 апреля в 15:51

@leeaao, Ну а что не понятно в комменте? Я как раз и описал несколько рисков, которые могут погубить ИИ

Развернуть 1 комментарий

😎

Автор поста открыл его для большого интернета, но комментирование и движухи доступны только участникам Клуба

Что вообще здесь происходит?

Войти или Вступить в Клуб